[发明专利]基于文本指纹算法的短文本集合相似度比较方法及系统有效
申请号: | 201911401853.5 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111159996B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 邱平 | 申请(专利权)人: | 福建福诺移动通信技术有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/126;G06F40/284 |
代理公司: | 北京易捷胜知识产权代理有限公司 11613 | 代理人: | 林振杰 |
地址: | 350003 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于改进的文本指纹算法的短文本集合相似度比较方法及系统,首先对每个文本进行分词处理,得到各个文本的单词集合;接着将每个文本的单词集合进行停用词过滤;然后对每个文本,动态设置K值,对停用词过滤后的单词集合提取K‑shingle,得到各个文本的K‑Shingle集合;最后根据各个文本的K‑Shingle集合计算两个文本之间的相似度。本发明能够提能够提高接口协议文本相似度比较的准确性。 | ||
搜索关键词: | 基于 文本 指纹 算法 集合 相似 比较 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建福诺移动通信技术有限公司,未经福建福诺移动通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911401853.5/,转载请声明来源钻瓜专利网。