[发明专利]一种信息匹配方法及装置在审
申请号: | 201510922330.0 | 申请日: | 2015-12-14 |
公开(公告)号: | CN106874294A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 黎久希 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京新知远方知识产权代理事务所(普通合伙)11397 | 代理人: | 侯俊丽 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息 匹配 方法 装置 | ||
技术领域
本申请涉及计算机技术领域,尤其涉及一种信息匹配方法及装置。
背景技术
随着信息技术的不断发展,越来越多的应用场景需要进行信息匹配,例如:搜索引擎的检索词匹配、论文的相似度匹配、拼写检查等。
目前,信息匹配技术通常为利用java语言的index of函数实现关键字匹配,即,建立预先写有若干关键字的文件,将用户在客户端输入的内容与该文件中所含的每个关键字进行匹配。假设预先建立的文件中包括100个关键字,那么,则需要进行100次的全文扫描才能完成对用户输入内容的信息匹配。在这个信息爆炸的时代,采用上述匹配方式进行匹配的效率非常低,无法适应信息量较大的场景。
现有技术不足在于:
现有的信息匹配方式效率低下,不能适应信息量较大的场景。
发明内容
本申请实施例提出了一种信息匹配方法及装置,以解决现有技术中信息匹配方式效率低下,不能适应信息量较大的场景的技术问题。
本申请实施例提供了一种信息匹配方法,包括如下步骤:
按照待匹配信息的字符顺序接收所述待匹配信息;
将待匹配信息在预先构建的有穷状态机DFA中进行匹配,所述DFA由预 设的关键字构成,所述DFA中每个状态的输出列表包含所述状态的子孙失败状态的输出列表,所述状态的子孙失败状态与所述状态的字符相同;
在匹配过程中,如果当前状态没有与所述待匹配信息的字符相匹配的下一状态,跳转到所述当前状态的失败状态继续匹配。
本申请实施例提供了一种信息匹配装置,包括:
接收模块,用于按照待匹配信息的字符顺序接收所述待匹配信息;
匹配模块,用于将待匹配信息在预先构建的有穷状态机DFA中进行匹配,所述DFA由预设的关键字构成,所述DFA中每个状态的输出列表包含所述状态的子孙失败状态的输出列表,所述状态的子孙失败状态与所述状态的字符相同;在匹配过程中,如果当前状态没有与所述待匹配信息的字符相匹配的下一状态,跳转到所述当前状态的失败状态继续匹配。
有益效果如下:
本申请实施例所提供的信息匹配方法及装置,预先构建由预设关键字构成的有穷状态机DFA,将待匹配信息在所述DFA中进行匹配,由此关键字的匹配即变成了状态机的跳转;由于本申请实施例中所述DFA每个状态的输出列表包含所述状态的子孙失败状态的输出列表,在匹配过程中,如果当前状态没有与所述待匹配信息的字符相匹配的下一状态,则跳转到所述当前状态的失败状态继续匹配,所述待匹配信息的匹配过程只需要随着所述DFA状态一步一步地往下一状态跳转,无需返回上一状态以匹配其他关键字,从而可以确保所述待匹配信息只需要扫描一遍即可完成匹配,极大地提高了匹配效率。
附图说明
下面将参照附图描述本申请的具体实施例,其中:
图1示出了本申请实施例中信息匹配方法实施的流程示意图;
图2示出了本申请实施例中DFA结构示意图;
图3示出了本申请实施例中DFA初始化时的示意图;
图4示出了本申请实施例中DFA构建完成后的结构示意图;
图5示出了本申请实施例中群组聊天限制的DFA示意图;
图6示出了本申请实施例中信息匹配装置的结构示意图。
具体实施方式
为了使本申请的技术方案及优点更加清楚明白,以下结合附图对本申请的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本申请的一部分实施例,而不是所有实施例的穷举。并且在不冲突的情况下,本说明中的实施例及实施例中的特征可以互相结合。
针对现有技术的不足,本申请实施例提出了一种信息匹配方法及装置,下面进行说明。
图1示出了本申请实施例中信息匹配方法实施的流程示意图,如图所示,所述信息匹配方法可以包括如下步骤:
步骤101、按照待匹配信息的字符顺序接收所述待匹配信息;
步骤102、将待匹配信息在预先构建的有穷状态机(DFA,Deterministic Finite Automata)中进行匹配,所述DFA由预设的关键字构成,所述DFA中每个状态的输出列表包含所述状态的子孙失败状态的输出列表,所述状态的子孙失败状态与所述状态的字符相同;
步骤103、在匹配过程中,如果当前状态没有与所述待匹配信息的字符相匹配的下一状态,跳转到所述当前状态的失败状态继续匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510922330.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:槽轮式鱼塘自动破冰装置
- 下一篇:双级五线单向通行互补省水船闸
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置