[发明专利]一种实体抽取方法、装置及设备在审
申请号: | 202010609557.0 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111985237A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 王萌萌 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 周伟 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实体 抽取 方法 装置 设备 | ||
1.一种实体抽取方法,所述方法包括:
获取待处理信息,所述待处理信息包括第一对象与第二对象之间至少两组交互的交互信息数据;
对所述待处理信息中每一交互信息数据进行多标签分类识别,以对所述待处理信息分别进行不同功能类型的标签标注,得到标签标注结果;
根据所述标签标注结果,对所述待处理消息分层进行实体抽取;
所述标签标注结果至少包括用于示出相应的交互信息数据中包含实体块的实体标签。
2.根据权利要求1所述的方法,对所述待处理信息分别进行不同功能类型的标签标注,包括以下至少之一:
对所述待处理信息进行具有交互类型标识功能的标签标注,确定每一交互信息数据的交互类型标签;
对所述待处理信息进行具有序列标识功能的标签标注,确定每一交互信息数据的序列标签;
对所述待处理信息进行具有信息来源标识功能的标签标注,确定每一交互信息数据的信息来源标签。
3.根据权利要求2所述的方法,对所述待处理信息分别进行不同功能类型的标签标注,包括:
依次获取所述待处理信息中的每一交互信息数据;
基于每一交互信息数据,获取与所述交互信息数据的相关交互信息数据;
根据所述交互信息数据和所述相关交互数据,对所述交互信息数据进行标签识别。
4.根据权利要求3所述的方法,获取与所述交互信息数据的相关交互数据,包括:
确定每一所述交互信息数据在所述待处理信息中的交互顺序;
获取交互顺序位于所述交互信息数据之前第一设定字段的交互信息数据;和/或,
获取交互顺序位于所述交互信息数据之后第二设定字段的交互信息数据。
5.根据权利要求2所述的方法,所述根据所述标签标注结果,对所述待处理消息分层进行实体抽取,包括:
根据所述标签标注结果,确定被标注实体标签的交互信息数据为实体类信息数据;
确定所述实体类信息中每一交互信息数据的序列标签;
根据所述序列标签,对所述实体类信息进行实体块识别,得到实体识别结果;
根据所述实体识别结果,执行以下操作中至少之一:实体块去重、实体块排序、实体块拼接,以得到实体抽取结果。
6.根据权利要求2所述的方法,所述交互类型标签包括以下至少之一:询问类型数据、重复类型数据、否定类型数据、提供信息类型数据。
7.根据权利要求2所述的方法,所述序列标签包括以下至少之一:开始数据、暂停数据、重新开始数据、结束数据。
8.根据权利要求1-7中任一项所述的方法,所述待处理消息为语音转录对话文本。
9.一种实体抽取装置,所述装置包括:
信息获取模块,用于获取待处理信息,所述待处理信息包括第一对象与第二对象之间至少两组交互的交互信息数据;
标签识别模块,用于对所述待处理信息中每一交互信息数据进行多标签分类识别,以对所述待处理信息分别进行不同功能类型的标签标注,得到标签标注结果;
实体抽取模块,用于根据所述标签标注结果,对所述待处理消息分层进行实体抽取;
所述标签标注结果至少包括用于示出相应的交互信息数据中包含实体块的实体标签。
10.一种设备,所述设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行权利要求1-8中任一项所述的实体抽取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010609557.0/1.html,转载请声明来源钻瓜专利网。