[发明专利]基于相似度的数据信息储存方法及系统在审

申请号：	201810709543.9	申请日：	2018-07-02
公开（公告）号：	CN108959207A	公开（公告）日：	2018-12-07
发明（设计）人：	孙英辉;姚天	申请（专利权）人：	芜湖智权大数据运营有限公司
主分类号：	G06F17/22	分类号：	G06F17/22;G06F17/30
代理公司：	北京思创大成知识产权代理有限公司 11614	代理人：	张清芳
地址：	241000 安徽省芜湖市***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	公开了一种基于相似度的数据信息储存方法及系统。该方法可以包括：根据待储存信息，获得对应的概要字符串，并提取概要字符串的多个关键词；检索多个关键词，获得多个已知字符串；基于概要字符串分别与每一个已知字符串进行计算，获得已知字符串对应的相似度系数；设置相似度阈值，删除相似度系数小于相似度阈值的已知字符串，获得已知字符串集合；在已知字符串集合中，将相似度系数最大的已知字符串作为对比字符串；将对比字符串对应的所属领域作为待储存信息的所属领域。本发明通过对比概要字符串与已知字符串，分类关键词并计算相似性，将储存的信息分类，提升储存与查找的效率与精度。
搜索关键词：	字符串相似度储存字符串集合储存信息数据信息所属领域分类关键词信息分类检索删除查找
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于相似度的数据信息储存方法，包括：根据待储存信息，获得对应的概要字符串，并提取所述概要字符串的多个关键词；检索所述多个关键词，获得多个已知字符串；基于所述概要字符串分别与每一个所述已知字符串进行计算，获得所述已知字符串对应的相似度系数；设置相似度阈值，删除所述相似度系数小于所述相似度阈值的已知字符串，获得已知字符串集合；在所述已知字符串集合中，将相似度系数最大的已知字符串作为对比字符串；将所述对比字符串对应的所属领域作为所述待储存信息的所属领域。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于芜湖智权大数据运营有限公司，未经芜湖智权大数据运营有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810709543.9/，转载请声明来源钻瓜专利网。

上一篇：一种优化Vue前端表格组件渲染性能的方法及系统
下一篇：分析CORS站接收卫星数据质量的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于相似度的数据信息储存方法及系统在审

专利文献下载