[发明专利]一种基于事件三元组的信访目的多分类装置及其方法在审

专利信息
申请号: 202011455907.9 申请日: 2020-12-10
公开(公告)号: CN112380868A 公开(公告)日: 2021-02-19
发明(设计)人: 张良均;王宏刚;施兴;林碧娴;张敏;赵云龙;刘名军;莫济成;周东平 申请(专利权)人: 广东泰迪智能科技股份有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F40/30;G06F40/211;G06N3/04;G06N3/08;G06Q50/18;G06Q50/26
代理公司: 深圳至诚化育知识产权代理事务所(普通合伙) 44728 代理人: 刘英
地址: 510000 广东省广州市高*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 事件 三元 信访 目的 分类 装置 及其 方法
【说明书】:

发明涉及自然语言处理领域,尤其是一种基于事件三元组的信访目的多分类装置及其方法,针对信访件信访详情的主体信息精准提取的问题,现提出如下方案,其多分类装置包括:信访件预处理模块:用于信访件详情的分句、分词和词性标注,形成句子集、词集和词性集;命名实体修正模块:用于识别及提取信访件详情命名实体,并对词集和词性集进行修正;事件三元组构建模块:用于对所述修正后的词集和词性集构建事件三元组,本发明实现了基于事件三元组的信访件信访目的多分类,为信访相关业务人员提供了便捷的技术支持。

技术领域

本发明涉及自然语言处理领域,尤其涉及一种基于事件三元组的信访目的多分类装置及其方法。

背景技术

目前随着深度学习在自然语言处理领域的不断应用,一些经典的自然语言处理问题已经得到很好解决,如文本分类问题。但深度学习模型为一种黑盒模型,采用端到端的训练方法,人们无法在模型训练过程中对特征做过多操作,因此为保障分类模型的效果,则需更准确的提取输入模型的特征。

信访件是公民向国家政党、政府等反映情况,表达自身意见,请求解决问题的一种形式。对信访件进行信访目的分类,可有效帮助相关业务人员快速理解信件目的、分派信件等提供信息支撑。但信访件详情中涵盖了信访人反映事件的原因、经过、自身所处的现状等,且存在为构建弱者形象过多描述自身处境艰难的信息,此部分信息对识别信访目的的识别意义不大,属于冗余信息。现有技术多为对信件详情提取摘要或仅提取命名实体等作为特征输入分类模型中,易存在关键信息遗漏或与原文意见差距过大,因此需对输入分类模型中的特征进行更精准的提取。

综上所述,为解决信访件信访详情的主体信息精准提取的问题,提高信访件信访目的分类效果,本发明提出了一种基于事件三元组的信访件信访目的多分类方法和装置。该方法充分考虑了信访件详情多含描述事件原因、经过、自身现状等冗余信息,通过构建事件三元组并提取关键句形式,得到描述信访详情的主体信息,且为减少分词误差通过命名实体识别以修正分词结果,提高信访件信访目的多分类的准确性。

发明内容

基于背景技术存在的技术问题,本发明提出了一种基于事件三元组的信访目的多分类装置及其方法。

本发明提出的一种基于事件三元组的信访件信访目的多分类装置,包括:

信访件预处理模块:用于信访件详情的分句、分词和词性标注,形成句子集、词集和词性集;

命名实体修正模块:用于识别及提取信访件详情命名实体,并对词集和词性集进行修正;

事件三元组构建模块:用于对所述修正后的词集和词性集构建事件三元组;

综合特征构建模块:用于提取关键句并与事件三元组融合成综合特征;

信访目的多分类模块:用于基于所述综合特征,进行信访目的多分类。

优选的,所述信访件预处理模块,具体包括:分句处理单元:用于将输入的信访件详情文本按照预设的符号进行拆分,得到所述句子集;分词和词性标注处理单元:用于将分句后的句子集进行分词和词性标注,得到所述的词集和词性集。

优选的,所述事件三元组构建模块,具体包括:

事件三元组初构建单元:用于对修正后的词集和词性集进行语义角色标注,提取事件三元组集;

事件三元组补充单元:用于对初构建后为空的事件三元组进行补充,通过对修正后的词集和词性集进行依存句法分析,提取主谓关系和动宾关系组成事件三元组。

优选的,所述综合特征构建模块,具体包括:

关键句提取单元:用于根据预设的领域关键词集对所述的句子集提取关键句集;

特征融合单元:用于对关键句集和事件三元组集按照在信访件详情中的顺序进行排序及拼接,形成待分类的综合特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东泰迪智能科技股份有限公司,未经广东泰迪智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011455907.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top