[发明专利]信息分析的方法及装置有效

专利信息
申请号: 201511026271.5 申请日: 2015-12-31
公开(公告)号: CN106933798B 公开(公告)日: 2020-09-08
发明(设计)人: 杨锦峰 申请(专利权)人: 北京城市网邻信息技术有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/205
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 杨贝贝;黄健
地址: 100015 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息 分析 方法 装置
【权利要求书】:

1.一种信息分析的方法,其特征在于,包括:

接收用户输入的待分析文本;

对所述待分析文本进行分词处理;

确定各分词分别所属的语义标签;

将所述各分词分别所属的语义标签与匹配规则进行匹配,得到所述各分词分别所属的语义标签与所述匹配规则中的第一规则匹配的匹配结果,并根据所述匹配结果确定分析结果;

所述将所述各分词分别所属的语义标签与匹配规则进行匹配,得到所述各分词分别所属的语义标签与所述匹配规则中的第一规则匹配的匹配结果,并根据所述匹配结果确定分析结果,包括:

将所述各分词分别所属的语义标签作为主串,输入至AC自动机进行匹配,确定匹配的终节点为第一节点,并从所述第一节点的输出表获得所述分析结果;其中,所述AC自动机中各节点的转向表根据所述匹配规则生成;所述AC自动机的根节点到所述第一节点的路径与所述第一规则对应;

所述将所述各分词分别所属的语义标签作为主串,输入至AC自动机进行匹配之前,还包括:

根据所述匹配规则,生成所述各节点的转向表;所述转向表中包括预设语义标签以及与所述预设语义标签对应的所述各节点的下一级节点;

根据所述各节点作为终节点时分别对应的分析结果,生成所述各节点的输出表;

所述匹配规则包括采用正则表达式和所述预设语义标签描述的规则,以及仅采用所述预设语义标签描述的规则;所述将所述各分词分别所属的语义标签作为主串,输入至AC自动机进行匹配之前,还包括:

根据所述采用正则表达式和所述预设语义标签描述的规则,生成所述各节点的正则表;所述正则表中包括所述预设语义标签、与所述预设语义标签对应的所述各节点的下一级节点以及与所述预设语义标签对应的正则表达式;

相应的,所述根据所述匹配规则,生成所述各节点的转向表,包括:

根据所述匹配规则中采用所述预设语义标签描述的规则,生成所述各节点的转向表;

所述将所述各分词分别所属的语义标签作为主串,输入至AC自动机进行匹配,包括:

判断所述各分词分别所属的语义标签中的第N个语义标签是否包括在第二节点的转向表中;其中,N为大于0小于M的正整数,M为所述语义标签的个数,所述第二节点为根节点的第N-1级子节点;

若是,则转移至所述第二节点的转向表中所述第N个语义标签对应的第三节点,形成所述第二节点与所述第三节点之间的路径;

判断所述第N个语义标签是否包括在所述第二节点的正则表中,且所述第N个语义标签对应的分词满足所述第二节点的正则表中所述第N个语义标签对应的正则表达式;

若是,则转移至所述第二节点的正则表中所述第N个语义标签对应的第四节点,形成所述第二节点与所述第四节点之间的路径。

2.根据权利要求1所述的方法,其特征在于,所述确定各分词分别所属的语义标签之前,还包括:将所述各分词中的无效分词去除,获得所述各分词中的有效分词;

所述确定各分词分别所属的语义标签,包括:

确定所述各分词中的各有效分词分别所属的语义标签。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京城市网邻信息技术有限公司,未经北京城市网邻信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201511026271.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top