[发明专利]一种实现智能联想的行业词语关联度分词方法在审
申请号: | 201310430100.3 | 申请日: | 2013-09-22 |
公开(公告)号: | CN104462052A | 公开(公告)日: | 2015-03-25 |
发明(设计)人: | 周小伟;商杰 | 申请(专利权)人: | 上海博科资讯股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200333 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明为了弥补现有汉语分词技术的不足,提出了一种实现智能联想的行业词语关联度分词方法。利用基于语义距离的概念相似度计算公式来获得任一概念的相关概念,从而给出了属于此行业领域的语义词典完整的自动构建方法。建立分布式递归模型,将本地词库写入云端词库,检索行业文章并存数据库,用云端词库过滤出属于本行业的词汇,根据队列中消息读取云端数据,对数据进行去噪并分词,取出出现次数最多的N个词,或取出出现次数最多的一个词,统计单据数量和词语出现的次数。之后,计算词语在每张单据中出现的平均次数。最后,计算词语出现次数的标准差,从而实现快速、准确联想。 | ||
搜索关键词: | 一种 实现 智能 联想 行业 词语 关联 分词 方法 | ||
【主权项】:
一种实现智能联想的行业词语关联度分词方法,其特征在于,利用基于语义距离的概念相似度计算公式来获得任一概念的相关概念,从而给出了属于此行业领域的语义词典完整的自动构建方法。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海博科资讯股份有限公司,未经上海博科资讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310430100.3/,转载请声明来源钻瓜专利网。