[发明专利]一种基于数据库的中文全文本搜索方法在审

申请号：	201711038679.3	申请日：	2017-10-28
公开（公告）号：	CN107885798A	公开（公告）日：	2018-04-06
发明（设计）人：	徐顺格;范渊	申请（专利权）人：	杭州安恒信息技术有限公司
主分类号：	G06F17/30	分类号：	G06F17/30;G06F17/27
代理公司：	杭州赛科专利代理事务所(普通合伙)33230	代理人：	郭薇,冯年群
地址：	310052 浙江省杭州***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于数据库的中文全文本搜索方法，在数据库中集成中文分词模块，生成解释器并对要搜索的中文数据进行分词，将分词后的中文数据和分词前的中文数据都存入数据库并建立关联，在存储分词后的中文数据的字段上建立索引，对分词后的中文数据进行搜索，获得搜索结果，经过分词后的中文数据和分词前的中文数据间的关联，获得分词前的中文数据，即全文本搜索的结果。本发明能对大量数据进行快速全文本搜索，效率高；经测试，一千万条数据量中利用LIKE通配符需要20166.568毫秒进行全文本的搜索，而本发明只需要0.651毫秒。本发明弥补当前主流的数据库，包括MySQL和PostgreSQL的中文全文本搜索的空白。
搜索关键词：	一种基于数据库中文文本搜索方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于数据库的中文全文本搜索方法，其特征在于：所述方法包括以下步骤：步骤1：为所述数据库集成中文分词模块；步骤2：根据搜索需求，利用中文分词模块生成解释器，对所述数据库中要搜索的中文数据进行分词；步骤3：将分词后的中文数据和分词前的中文数据存入数据库，建立分词后的中文数据和分词前的中文数据间的关联，并在数据库中用于存储分词后的中文数据的字段上建立索引；步骤4：通过搜索函数对分词后的中文数据进行搜索；步骤5：获得分词后的中文数据的搜索结果，经过分词后的中文数据和分词前的中文数据间的关联，获得分词前的中文数据，获得全文本搜索的结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术有限公司，未经杭州安恒信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711038679.3/，转载请声明来源钻瓜专利网。

上一篇：一种混合动力汽车发动机控制系统
下一篇：绳牵引轨道式架空乘人装置倒“Ｖ”字形轨道伸缩装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于数据库的中文全文本搜索方法在审

专利文献下载