文本相似度计算旨在识别两个文本在语义上是否相似。
这是自然语言处理领域的重要研究方向。
它在智能问答,信息检索等领域起着重要作用,具有很高的商业价值。
最近,Spiritical Knowledge Service团队对中文文本相似度的计算进行了研究,并取得了阶段性成果:1)在第十四届全国知识图谱和语义计算大会(CCKS:ChinaConferenceonKnowledgeGraphandSemanticComputing)上发表了相关论文[1] ;“用于中文语义匹配的神经融合模型”。
该会议是中国知识图谱,语义技术,链接数据等领域的核心学术会议。
它收集了相关的技术领域,例如知识表示,自然语言理解,知识获取,智能问答,链接数据,图形数据库,图形计算和自动推理。
以及学者学者和研究人员。
2)已经在“千字数据集:文本相似性”方面取得了进展。
评价[2]。
评估的文本相似性数据集包括三个公共文本相似性数据集,分别是哈尔滨工业大学(深圳)LCQMC,BQCorpus和Google的PAWS-X(中文)。
目前,SPIT知识服务团队在所有三个数据集中排名第一。
针对中文文本相似度计算的鲁棒性和普遍性,SPIT知识服务团队从以下几个方面进行了技术研究:1)针对中文特征的字符和词融合编码器; 2)汉字相似度编码器。
2)基于训练前的领域自适应训练模型; 3)基于目标应用程序域的多阶段模型微调。
相关技术已在上述公开评估中得到应用和验证。
语言智能通常被称为人工智能皇冠上的宝石。
未来,SPITZ知识服务团队将继续加深认知智能领域,在通用领域的文本相似度计算的基础上构建适应领域的文本相似度计算系统,并促进文本相似度在垂直领域的应用和应用。
领域。
的发展。
原文标题:[会员资格] Sibiz在中文相似度计算任务上的探索与进展文章出处:[微信公众号:深圳市汽车电子工业协会]欢迎您关注!请指出转载文章的来源。