[发明专利]一种文本相似度计算方法和装置有效
申请号: | 202110046179.4 | 申请日: | 2021-01-14 |
公开(公告)号: | CN112364947B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 张姗姗;姜巍;于游;赵永强 | 申请(专利权)人: | 北京育学园健康管理中心有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/194;G06F40/284;G06F40/30;G06F16/35;G06F16/31 |
代理公司: | 北京绘聚高科知识产权代理事务所(普通合伙) 11832 | 代理人: | 罗硕 |
地址: | 100000 北京市朝阳区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种文本相似度计算方法和装置,本发明实施例通过分别确定第一文本与第二文本中的标签关键词集合和非标签关键词集合;先基于预设的用于表示关键词之间关联关系的层次树,确定所述第一文本的第一标签关键词集合与所述第二文本的第二标签关键词集合的第一相似度;然后再基于预设的语义模型确定所述第一文本的第一非标签关键词集合与所述第二文本的第二非标签关键词集合的第二相似度;最后根据所述第一相似度和所述第二相似度确定所述第一文本与所述第二文本的文本相似度,通过提取文本中的关键词,并利用关键词计算出文本之间的相似度,从而达到快速计文本相似度的目的。 | ||
搜索关键词: | 一种 文本 相似 计算方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京育学园健康管理中心有限公司,未经北京育学园健康管理中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110046179.4/,转载请声明来源钻瓜专利网。
- 上一篇:图片加载方法、装置
- 下一篇:一种车道线识别方法及装置