[发明专利]一种抽取核心词的方法及装置有效
申请号: | 201310376577.8 | 申请日: | 2013-08-26 |
公开(公告)号: | CN104424177B | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 彭松 | 申请(专利权)人: | 高德软件有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王宝筠 |
地址: | 102200 北京市昌*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种抽取核心词的方法及装置,能够实现从用户输入的查询词中抽取出较为准确的核心词,从而达到提高查询准确率的目的,包括采用预置的分词方式对查询词进行切分,得到组成所述查询词的分词;将所述查询词的分词分别与核心词词库和非核心词词库中的词语进行匹配;若所述查询词的分词中存在与所述核心词词库匹配的分词和/或与所述非核心词词库匹配的分词,且存在未知分词,则将与所述核心词词库匹配的分词确定为所述查询词的核心词;以及,获取满足预置的核心词长度标准的未知分词或拼接未知分词得到的分词作为所述查询词的核心词,所述未知分词是指与所述核心词词库和所述非核心词词库中的词语均不匹配的分词。 | ||
搜索关键词: | 一种 抽取 核心 方法 装置 | ||
【主权项】:
一种抽取核心词的方法,其特征在于,包括:采用预置的分词方式对查询词进行切分,得到组成所述查询词的分词;将所述查询词的分词分别与预置的核心词词库和非核心词词库中的词语进行匹配;若所述查询词的分词中存在与所述核心词词库匹配的分词和/或与所述非核心词词库匹配的分词,且存在未知分词,则:将与所述核心词词库匹配的分词确定为所述查询词的核心词;以及,将满足预置的核心词长度标准的未知分词或拼接未知分词得到的分词作为所述查询词的核心词,所述未知分词是指与所述核心词词库和所述非核心词词库中的词语均不匹配的分词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高德软件有限公司,未经高德软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310376577.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种IP地址库检索方法及系统
- 下一篇:排版界面布局方法及装置