[发明专利]信息抽取方法及装置、通信消息分类方法及装置有效
申请号: | 202111190544.5 | 申请日: | 2021-10-13 |
公开(公告)号: | CN113627194B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 资康莉;贾耀仓;宫相坤;陈维伟 | 申请(专利权)人: | 北京中科海芯科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/284;G06F40/166 |
代理公司: | 北京鼎承知识产权代理有限公司 11551 | 代理人: | 夏华栋;顾可嘉 |
地址: | 100089 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 抽取 方法 装置 通信 消息 分类 | ||
本公开涉及深度学习技术领域,尤其涉及一种信息抽取方法及装置、通信消息分类方法及装置。对于同场次多方用户的通信消息,通过基于通信消息的重要性和上下文语义相关性筛选多方用户通信消息中的核心消息,然后对每组核心消息进行标注,可以避免多方用户通信消息中的无关通信消息对标注过程的影响,可以提高标注的精度和效率。基于此,也可以根据获取到的标注信息高效地对多方用户的通信消息进行分类。
技术领域
本公开涉及深度学习技术领域,尤其涉及一种信息抽取方法及装置、通信消息分类方法及装置。
背景技术
信息抽取(Information Extraction,缩写为IE)也被称作事件抽取(EventExtraction,缩写为EE),通常指从自然语言文本中,抽取出特定的事实性信息。
中文语言本身具有用词灵活多变的特点,且在多方会话场景下多方用户的通信消息中往往存在无关信息的干扰,这就导致无法对多方用户的通信消息实现高效、准确地信息抽取,同时也无法高效地对多方用户的通信消息进行分类。
发明内容
为了高效地对多方用户的通信消息进行信息抽取以及对多方用户的通信消息进行分类,本公开提供了一种信息抽取方法及装置、通信消息分类方法及装置。
一方面,本公开实施例提供了一种信息抽取方法,用于处理同场次多方用户的通信消息,所述方法包括:
基于所述通信消息的重要性和上下文语义相关性从所述多方用户的通信消息中筛选出至少一条核心消息;
对每组所述核心消息进行标注,每组所述核心消息包括一条所述核心消息或多条具有上下文关系的核心消息。
一方面,本公开实施例提供了一种通信消息分类方法,用于处理同场次多方用户的通信消息,所述方法包括:
合并每组核心消息的标注信息,每组所述核心消息包括一条核心消息或多条具有上下文关系的核心消息,所述核心消息为基于通信消息的重要性和上下文语义相关性从所述多方用户的通信消息中筛选的通信消息,所述标注信息包括事件标注实体和事件描述实体;
对每组所述核心消息的未标注信息进行分词处理;
根据每组核心消息的事件描述结果,将分词处理后的描述同一事件的各组所述核心消息按照发送时序拼接成篇章;
基于事件子类的关键词,根据各所述篇章中包括的事件子类的关键词,确定各所述篇章对应的事件子类。
一方面,本公开实施例提供了一种信息抽取装置,用于处理同场次多方用户的通信消息,包括:
筛选单元,用于基于所述通信消息的重要性和上下文语义相关性从所述多方用户的通信消息中筛选出至少一条核心消息;
标注单元,用于对每组所述核心消息进行标注,每组所述核心消息包括一条所述核心消息或多条具有上下文关系的核心消息。
一方面,本公开实施例提供了一种通信消息分类装置,用于处理同场次多方用户的通信消息,包括:
合并单元,用于合并每组核心消息的标注信息,每组所述核心消息包括一条核心消息或多条具有上下文关系的核心消息,所述核心消息为基于通信消息的重要性和上下文语义相关性从所述多方用户的通信消息中筛选的通信消息,所述标注信息包括事件标注实体和事件描述实体;
分词单元,用于对每组所述核心消息的未标注信息进行分词处理;
拼接单元,用于根据每组核心消息的事件描述结果,将分词处理后的描述同一事件的各组所述核心消息按照发送时序拼接成篇章;
确定单元,用于基于事件子类的关键词,根据各所述篇章中包括的事件子类的关键词,确定各所述篇章对应的事件子类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科海芯科技有限公司,未经北京中科海芯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111190544.5/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置