[发明专利]添加自定义分词的方法及装置在审
申请号: | 201710364767.6 | 申请日: | 2017-05-22 |
公开(公告)号: | CN107169115A | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 刘庆 | 申请(专利权)人: | 深圳市连用科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳中一联合知识产权代理有限公司44414 | 代理人: | 张全文 |
地址: | 518000 广东省深圳市福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 添加 自定义 分词 方法 装置 | ||
技术领域
本发明属于计算机技术领域,尤其涉及一种添加自定义分词的方法及装置。
背景技术
随着互联网数据规模的爆炸式增长,如何从海量的历史、实时数据中快速获取有用信息,变得越来越具有挑战性。搜索是获取信息最高效的途径之一,因此也是各类网站或者应用的基础标配功能。然而仅有强大的搜索引擎是不够的,还需要制订满足个人需要的个性化词库,而往往有些标准词库无法完美的达到预期效果,因此需要建立自定义分词库。
目前大部分中文分词插件包括bigdesk、head、inquisitor、marvel、kopf都是对索引进行浏览、查看或分析等,而IKAnalyzer(轻量级的中文分词插件)作为比较流行的中文分词插件却没有对添加自定义分词做很好的支持。现有的IKAnalyzer需要在添加自定义分词后重启整个ElasticSearch服务器才能加载到刚刚加入到自定义分词库的词。如果是在一个非常庞大的ElasticSearch集群环境,节点数可能达到几十甚至上百个节点,那么每个提供索引服务的节点都需要编辑更新下自定义分词库然后重启,然而ElasticSearch服务器重启的过程需要一段时间的等待,这将浪费时间。
综上可知,目前添加自定义分词的方法存在操作效率低的问题。
发明内容
有鉴于此,本发明实施例提供了添加自定义分词的方法及装置,以解决现有技术中添加自定义分词的方法存在操作效率低的问题。
本发明实施例的第一方面提供了一种添加自定义分词的方法,包括:
监听自定义录入请求;所述自定义录入请求至少包括自定义分词录入表单,所述自定义分词录入表单至少包括自定义分词;
在监听到自定义录入请求时,通过自定义分词追加函数将所述自定义分词写入自定义分词库中。
本发明实施例的第二方面提供了一种添加自定义分词的装置,包括:
监听单元,用于监听自定义录入请求;所述自定义录入请求至少包括自定义分词录入表单,所述自定义分词录入表单至少包括自定义分词;
写入单元,用于在监听到自定义录入请求时,通过自定义分词追加函数将所述自定义分词写入自定义分词库中。
本发明实施例的第三方面提供了一种终端设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
监听自定义录入请求;所述自定义录入请求至少包括自定义分词录入表单,所述自定义分词录入表单至少包括自定义分词;
在监听到自定义录入请求时,通过自定义分词追加函数将所述自定义分词写入自定义分词库中。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以下步骤:
监听自定义录入请求;所述自定义录入请求至少包括自定义分词录入表单,所述自定义分词录入表单至少包括自定义分词;
在监听到自定义录入请求时,通过自定义分词追加函数将所述自定义分词写入自定义分词库中。
本发明实施例通过监听自定义录入请求,在监听到自定义录入请求时,通过自定义分词追加函数将所述自定义分词写入自定义分词库中,新添加到自定义分词库中的词立即生效,因此无需重启服务器,节省了时间,提高了操作效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的添加自定义分词的方法的实现流程示意图;
图2是本发明实施例二提供的添加自定义分词的方法的实现流程示意图;
图3是本发明实施例二中步骤S205的具体实现流程示意图;
图4是本发明实施例四提供的添加自定义分词的方法的实现流程示意图;
图5是本发明实施例提供的添加自定义分词的装置的示意图;
图6是本发明实施例提供的终端设备的示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市连用科技有限公司,未经深圳市连用科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710364767.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种海量数据多维排序搜索方法
- 下一篇:默认搜索词的生成方法及装置