[发明专利]一种基于分词检索交互的方式在审
申请号: | 201810617412.8 | 申请日: | 2018-06-15 |
公开(公告)号: | CN108846094A | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 何中;汤海泉;严伟;戴建峰;顾永新;王斌;何登;巢振军 | 申请(专利权)人: | 江苏中威科技软件系统有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 226000 江苏省南通*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分词 词组 检索 智能分词 文本 粘贴 复制 块状方式 文本数据 业务系统 自由拖拽 组合词组 文本框 拖拽 选中 展示 | ||
本发明公开了一种基于分词检索交互的方式,包括以下步骤:A、选择文本并复制,粘贴进系统,系统将自动进行智能分词,分词后将词组以块状方式进行展示;B、块状分词支持选中,点击后将分词带入上方的文本框,再次点击选中的分词,则取消选择;C、进行检索交互,本发明可对一段文本进行智能分词,复制粘贴文本数据后会自动对文本进行分词,分词后的词组以块状显示出来,用户可自由拖拽组合词组,单个词组或组合的词组可作为关键词进行检索,只需要将关键词拖拽到业务系统上,便可自动进行检索以及尝试,方便快捷。
技术领域
本发明涉及检索技术领域,具体为一种基于分词检索交互的方式。
背景技术
检索是一种汉语词汇,指从用户特定的信息需求出发,对特定的信息集合采用一定的方法、技术手段,根据一定的线索与规则从中找出相关信息;在网络时代,我们无时无刻地进行着检索。在因特网上进行检索主要有两种方式:目录浏览和使用搜索引擎;目录浏览的方式即雅虎搜索引擎采用的方式,用户可以根据自己的需要点击目录,深入下一层子目录,从而找到自己需要的信息。这种方式便于查找某一类的信息集合,但是精确定位的能力不强;搜索引擎是目前最为常用的一种网络检索工具。用户只需要提交自己的需求,搜索引擎就能返回大量结果。这些结果按照和检索提问的相关性进行排序。
目前检索交互的方式大多是通过手动输入文字的方式进行检索,比如谷歌、百度等搜索引擎,我们通过键盘输入等方式,来进行检索,多了手动输入的环节。并且如果需要跨系统的进行检索,需要在多个系统进行重复输入,比较繁琐。
发明内容
本发明的目的在于提供一种基于分词检索交互的方式,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于分词检索交互的方式,包括以下步骤:
A、选择文本并复制,粘贴进系统,系统将自动进行智能分词,分词后将词组以块状方式进行展示;
B、块状分词支持选中,点击后将分词带入上方的文本框,再次点击选中的分词,则取消选择;
C、进行检索交互,拖拽检索后,将检索后的结果直接展示。
优选的,所述步骤A中智能分词方法如下:
a、获取待分词文本的特征信息,其中,所述特征信息包括段落划分、标点符号或空格符中至少之一;
b、根据所述特征信息,确定所述待分词文本中的所有自然区间;
c、将自然区间划分为歧义区间和非歧义区间;
d、确定歧义区间中的候选词,并将候选词与非歧义区间中的文本进行匹配;
e、根据匹配结果确定候选词的分词规则,并按照分词规则对歧义区间的文本进行分词处理。
优选的,所述步骤C中检索交互包括单个分词拖拽检索;文本框多个分词,组合一起检索;多选组合进行检索。
优选的,所述步骤d中文本匹配方法如下:
1)、将被测文本中的字符进行独立分割,得到分割后的字符串;
2)、将分割后的字符串中的字符分别与倒排字库中的关键字符进行匹配;所述倒排字库是对输入的关键字进行逐字符分解并记录每个关键字符在所述关键字中的位置信息后形成的;
3)、按照设定的模糊度确定规则,确定匹配成功的每个关键字中关键字符匹配时用到的模糊度值,得到每个关键字的匹配模糊度;
4)、根据每个关键字的匹配模糊度,确定输入的关键字的平均模糊度,根据所述平均模糊度确定所述被测文本是否符合过滤条件。
优选的,所述步骤e中的分词处理方法如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏中威科技软件系统有限公司,未经江苏中威科技软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810617412.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:支持多用户操作的业务处理方法及系统
- 下一篇:一种数据处理方法及装置