[发明专利]一种分词方法及装置、检索方法及装置在审
申请号: | 201510850300.3 | 申请日: | 2015-11-27 |
公开(公告)号: | CN106815195A | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | 郑佳栋;王生;李欣;周大良;王伟 | 申请(专利权)人: | 方正国际软件(北京)有限公司;方正国际软件有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司11291 | 代理人: | 黄志华 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种分词方法及装置、检索方法及装置,用于提高文本分词的准确性,提高搜索命中概率。其中,所述分词方法包括将待分词文本进行分词,并和预测词典中的词进行匹配,得到第一次分词结果和未登录字;以所述未登录字为基础,向前或向后截取一段文本作为与所述未登录字对应的未登录词;判断所述未登录词是否已存在于所述第一次分词结果中,当所述第一次分词结果中没有所述未登录词时,将所述未登录词添加到第一次分词结果中,得到作为最终分词结果的第二次分词结果,以使得根据所述第二次分词结果和用户输入的关键字找到多个与所述关键字相关的分词。 | ||
搜索关键词: | 一种 分词 方法 装置 检索 | ||
【主权项】:
一种分词方法,其特征在于,所述分词方法包括:将待分词文本进行分词,并和预测词典中的词进行匹配,得到第一次分词结果和未登录字;以所述未登录字为基础,向前或向后截取一段文本作为与所述未登录字对应的未登录词;判断所述未登录词是否已存在于所述第一次分词结果中,当所述第一次分词结果中没有所述未登录词时,将所述未登录词添加到第一次分词结果中,得到作为最终分词结果的第二次分词结果,以使得根据所述第二次分词结果和用户输入的关键字找到多个与所述关键字相关的分词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于方正国际软件(北京)有限公司;方正国际软件有限公司,未经方正国际软件(北京)有限公司;方正国际软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510850300.3/,转载请声明来源钻瓜专利网。