[发明专利]一种基于事件三元组的信访目的多分类装置及其方法在审
申请号: | 202011455907.9 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112380868A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 张良均;王宏刚;施兴;林碧娴;张敏;赵云龙;刘名军;莫济成;周东平 | 申请(专利权)人: | 广东泰迪智能科技股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F40/211;G06N3/04;G06N3/08;G06Q50/18;G06Q50/26 |
代理公司: | 深圳至诚化育知识产权代理事务所(普通合伙) 44728 | 代理人: | 刘英 |
地址: | 510000 广东省广州市高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 事件 三元 信访 目的 分类 装置 及其 方法 | ||
1.一种基于事件三元组的信访件信访目的多分类装置,其特征在于,包括:
信访件预处理模块:用于信访件详情的分句、分词和词性标注,形成句子集、词集和词性集;
命名实体修正模块:用于识别及提取信访件详情命名实体,并对词集和词性集进行修正;
事件三元组构建模块:用于对所述修正后的词集和词性集构建事件三元组;
综合特征构建模块:用于提取关键句并与事件三元组融合成综合特征;
信访目的多分类模块:用于基于所述综合特征,进行信访目的多分类。
2.根据权利要求1所述的一种基于事件三元组的信访目的多分类装置,其特征在于,所述信访件预处理模块,具体包括:分句处理单元:用于将输入的信访件详情文本按照预设的符号进行拆分,得到所述句子集;分词和词性标注处理单元:用于将分句后的句子集进行分词和词性标注,得到所述的词集和词性集。
3.根据权利要求1所述的基于事件三元组的信访件信访目的多分类装置,其特征在于,所述事件三元组构建模块,具体包括:
事件三元组初构建单元:用于对修正后的词集和词性集进行语义角色标注,提取事件三元组集;
事件三元组补充单元:用于对初构建后为空的事件三元组进行补充,通过对修正后的词集和词性集进行依存句法分析,提取主谓关系和动宾关系组成事件三元组。
4.根据权利要求1所述的基于事件三元组的信访件信访目的多分类装置,其特征在于,所述综合特征构建模块,具体包括:
关键句提取单元:用于根据预设的领域关键词集对所述的句子集提取关键句集;
特征融合单元:用于对关键句集和事件三元组集按照在信访件详情中的顺序进行排序及拼接,形成待分类的综合特征。
5.根据权利要求1所述的基于事件三元组的信访件信访目的多分类装置,其特征在于,所述信访目的多分类模块是用于将综合特征输入预设的已训练的文本多分类模型中,结合预设的信访目的类别,得到信访件的信访目的分类结果。
6.一种基于事件三元组的信访目的多分类方法,其特征在于,包括以下步骤:
S1:将待分类的信访件详情文本进行分句、分词和词性标注形成句子集、词集和词性集;
S2:通过命名实体识别与抽取以修正词集和词性集;
S3:由修正后的词集和词性集构建事件三元组;
S4:根据领域关键词集提取关键句,融合关键句和事件三元组形成综合特征;
S5:基于综合特征进行信访件信访目的多分类。
7.根据权利要求6所述的一种基于事件三元组的信访目的多分类方法,其特征在于,所述S1中,待分类信访件详情文本进行分句、分词和词性标注形成句子集S=(s1,s2,s3,...,su)、词集W=(w1,w2,w3,...,wv)和词性集P=(p1,p2,p3,...,pv),其中u为信访件详情文本形成的句子数,v为信访件详情文本形成的词个数且词性个数与词个数相等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东泰迪智能科技股份有限公司,未经广东泰迪智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011455907.9/1.html,转载请声明来源钻瓜专利网。