[发明专利]一种实现智能联想的行业词语关联度分词方法在审
申请号: | 201310430100.3 | 申请日: | 2013-09-22 |
公开(公告)号: | CN104462052A | 公开(公告)日: | 2015-03-25 |
发明(设计)人: | 周小伟;商杰 | 申请(专利权)人: | 上海博科资讯股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200333 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 智能 联想 行业 词语 关联 分词 方法 | ||
1.一种实现智能联想的行业词语关联度分词方法,其特征在于,利用基于语义距离的概念相似度计算公式来获得任一概念的相关概念,从而给出了属于此行业领域的语义词典完整的自动构建方法。
2.根据权利要求1的一种方法,其特征在于,建立一个分布式递归模型。
3.根据权利要求1的一种方法,其特征在于,将本地词库写入云端词库。
4.根据权利要求1的一种方法,其特征在于,检索属于同一行业的文章并存数据库。
5.根据权利要求1的一种方法,其特征在于,用云端词库过滤出属于本行业的词汇。
6.根据权利要求1的一种方法,其特征在于,根据队列中消息读取云端数据。
7.根据权利要求1的一种方法,其特征在于,对数据进行去噪并分词。
8.根据权利要求7的一种方法,其特征在于,取出出现次数最多的N个词,或取出出现次数最多的一个词。
9.根据权利要求7的一种方法,其特征在于,统计单据数量和词语出现的次数。
10.根据权利要求7的一种方法,其特征在于,计算词语在每张单据中出现的平均次数。
11.根据权利要求7的一种方法,其特征在于,计算词语出现次数的标准差,公式为:V(A,B)=∑(A- )(B-)/(n-1)?A?B。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海博科资讯股份有限公司,未经上海博科资讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310430100.3/1.html,转载请声明来源钻瓜专利网。