[发明专利]信息分析的方法及装置有效
申请号: | 201511026271.5 | 申请日: | 2015-12-31 |
公开(公告)号: | CN106933798B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 杨锦峰 | 申请(专利权)人: | 北京城市网邻信息技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/205 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨贝贝;黄健 |
地址: | 100015 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 分析 方法 装置 | ||
本发明提供一种信息分析的方法及装置;一种信息分析的方法包括:接收用户输入的待分析文本;对所述待分析文本进行分词处理;确定各分词分别所属的语义标签;将所述各分词分别所属的语义标签与匹配规则进行匹配,得到所述各分词分别所属的语义标签与所述匹配规则中的第一规则匹配的匹配结果,并根据所述匹配结果确定分析结果。本发明解决了现有技术中匹配规则较多的问题。
技术领域
本发明涉及信息技术领域,尤其涉及一种信息分析的方法及装置。
背景技术
随着互联网的普及和海量信息的涌现,如何快速有效的分析信息已成为制约信息技术发展的一个全局性问题。
现有技术中,一种信息分析的方法为根据匹配规则对待分析文本中的关键字进行匹配,并根据匹配结果确定分析结果,该分析结果例如可以为待分析文本所属的分类、待分析文本对应的操作需求或待分析文本匹配的某个或某些关键字等。其中,该匹配规则为根据预先确定的关键字所设定的匹配规则。
但是,现有技术中存在匹配规则较多的问题。
发明内容
本发明提供一种信息分析的方法及装置,用以解决现有技术中匹配规则较多的问题。
本发明提供一种信息分析的方法,包括:
接收用户输入的待分析文本;
对所述待分析文本进行分词处理;
确定各分词分别所属的语义标签;
将所述各分词分别所属的语义标签与匹配规则进行匹配,得到所述各分词分别所属的语义标签与所述匹配规则中的第一规则匹配的匹配结果,并根据所述匹配结果确定分析结果。
可选的,在本发明一实施例中,所述将所述各分词分别所属的语义标签与匹配规则进行匹配,得到所述各分词分别所属的语义标签与所述匹配规则中的第一规则匹配的匹配结果,并根据所述匹配结果确定分析结果,包括:
将所述各分词分别所属的语义标签作为主串,输入至AC自动机进行匹配,确定匹配的终节点为第一节点,并从所述第一节点的输出表获得所述分析结果;其中,所述AC自动机中各节点的转向表根据所述匹配规则生成;所述AC自动机的根节点到所述第一节点的路径与所述第一规则对应。
可选的,在本发明一实施例中,所述将所述各分词分别所属的语义标签作为主串,输入至AC自动机进行匹配之前,还包括:
根据所述匹配规则,生成所述各节点的转向表;所述转向表中包括预设语义标签以及与所述预设语义标签对应的所述各节点的下一级节点;
根据所述各节点作为终节点时分别对应的分析结果,生成所述各节点的输出表。
可选的,在本发明一实施例中,所述匹配规则包括采用正则表达式和所述预设语义标签描述的规则,以及仅采用所述预设语义标签描述的规则;所述将所述各分词分别所属的语义标签作为主串,输入至AC自动机进行匹配之前,还包括:
根据所述采用正则表达式和所述预设语义标签描述的规则,生成所述各节点的正则表;所述正则表中包括所述预设语义标签、与所述预设语义标签对应的所述各节点的下一级节点以及与所述预设语义标签对应的正则表达式;
相应的,所述根据所述匹配规则,生成所述各节点的转向表,包括:
根据所述匹配规则中采用所述预设语义标签描述的规则,生成所述各节点的转向表。
可选的,在本发明一实施例中,所述将所述各分词分别所属的语义标签作为主串,输入至AC自动机进行匹配,包括:
判断所述各分词分别所属的语义标签中的第N个语义标签是否包括在第二节点的转向表中;其中,N为大于0小于M的正整数,M为所述语义标签的个数,所述第二节点为根节点的第N-1级子节点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京城市网邻信息技术有限公司,未经北京城市网邻信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511026271.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种地下饮用水净化装置
- 下一篇:一种高产水量净水机净水系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置