[发明专利]文本相似度的判断方法、装置以及计算机设备在审
申请号: | 202011231992.0 | 申请日: | 2020-11-06 |
公开(公告)号: | CN112364620A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 杨威 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/284;G06N20/10 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种文本相似度的判断方法、装置以及计算机设备,其中,方法包括:获取需要判断相似度的第一文本和第二文本;根据所述第一文本和第二文本获取对应的关键词库;基于所述关键词库提取文本的各关键词,并根据各关键词对应各权重值生成文本权重向量;根据相似度计算公式计算所述第一文本权重向量和所述第二文本权重向量的相似度值;根据所述相似度值判断所述第一文本与所述第二文本是否相似。本发明的有益效果:通过为不同的关键词设置不同的权重,并且用权重来将第一文本和第二文本向量化,使其基于关键词的权重值计算相似度,从而可以提高第一文本和第二文本相似度判断与人为判断更接近。 | ||
搜索关键词: | 文本 相似 判断 方法 装置 以及 计算机 设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011231992.0/,转载请声明来源钻瓜专利网。