[发明专利]文本相似度计算方法及装置、存储介质、电子设备在审
申请号: | 201910746144.4 | 申请日: | 2019-08-13 |
公开(公告)号: | CN110489751A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 刘文强;程序;谢思发;张涵宇;江小琴 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/36;G06K9/62 |
代理公司: | 44232 深圳市隆天联鼎知识产权代理有限公司 | 代理人: | 刘抗美<国际申请>=<国际公布>=<进入 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供一种文本相似度计算方法及装置、电子设备、存储介质;涉及计算机技术领域。所述文本相似度计算方法包括:获取目标文本以及所述目标文本对应的知识图谱数据,并对所述知识图谱数据进行转换处理以确定所述知识图谱数据对应的关系特征向量;对所述目标文本进行分词处理,确定所述目标文本对应的原始语句序列;通过所述关系特征向量以及预建立的注意力模型确定所述原始语句序列对应的第一文本向量;获取预设文本的第二文本向量,并根据预设算法计算所述第一文本向量以及所述第二文本向量以确定所述目标文本与所述预设文本的相似度。本公开能够提高文本内容的表示效果,进而提升计算文本相似度的准确性。 | ||
搜索关键词: | 目标文本 文本向量 文本相似度 图谱数据 关系特征 语句序列 文本 向量 预设 计算方法及装置 计算机技术领域 注意力模型 存储介质 电子设备 分词处理 获取目标 文本内容 预设算法 转换处理 相似度 | ||
【主权项】:
1.一种文本相似度计算方法,其特征在于,包括:/n获取目标文本以及所述目标文本对应的知识图谱数据,并对所述知识图谱数据进行转换处理以确定所述知识图谱数据对应的关系特征向量;/n对所述目标文本进行分词处理,确定所述目标文本对应的原始语句序列;/n通过所述关系特征向量以及预建立的注意力模型确定所述原始语句序列对应的第一文本向量;/n获取预设文本的第二文本向量,并根据预设算法对所述第一文本向量以及所述第二文本向量进行计算以确定所述目标文本与所述预设文本的相似度。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910746144.4/,转载请声明来源钻瓜专利网。