[发明专利]会话内容识别方法、装置、设备及计算机可读介质有效
申请号: | 202111268692.4 | 申请日: | 2021-10-29 |
公开(公告)号: | CN113705250B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 向宇;杨怡雯 | 申请(专利权)人: | 北京明略昭辉科技有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F16/35;G06F40/166 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 曾军 |
地址: | 100098 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 会话 内容 识别 方法 装置 设备 计算机 可读 介质 | ||
本申请涉及一种会话内容识别方法、装置、设备及计算机可读介质。该方法包括:获取会话文本,并将会话文本分割为至少一个目标会话片段;将目标会话片段输入预设的会话类型识别模型,以对目标会话片段添加分类标签;基于目标会话片段抽取出分类标签对应的目标事件。本申请通过分割会话并进行事件抽取,能够根据会话的上下文逻辑关系识别会话的核心内容,从而使得会话内容的识别更加符合用户的真实想法,准确度更高,解决了存在逻辑的会话内容提取不准确的技术问题。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种会话内容识别方法、装置、设备及计算机可读介质。
背景技术
随着即时通讯技术的迅猛发展,企业与客户之间除了面对面沟通、电话沟通这类传统的交流方式之外,在线即时通讯沟通也开始占据重要的一隅,甚至由于兼具实时、便捷、可存证等优点而被广泛使用。企业为了更快速、精准地抓住客户的需求、偏好,也诞生了利用深度学习对客服人员与客户的即时通讯会话来提取会话内容的技术手段,以为挖掘客户潜在需求和偏好奠定基础。企业也可以通过了解客服人员与客户的会话内容,来及时发现服务存在的问题,还能够挖掘到客户对产品的真实评价,以及新的需求,为改进现有产品,研发新产品提供线索和灵感。
目前,相关技术中,主要是将会话进行分词后,通过词频高低来形成词云,进而利用词云来分析会话内容。但是,由于会话中存在人与人之间沟通交流的语言逻辑,而且不只是单句中存在逻辑关系,会话的上下文之间也存在前后关联的逻辑,因此分词、词频、词云等技术特征不足以准确的反映会话的核心内容,也就难以准确的为企业提供支持。
针对存在逻辑的会话内容识别不准确的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供了一种会话内容识别方法、装置、设备及计算机可读介质,以解决存在逻辑的会话内容提取不准确的技术问题。
根据本申请实施例的一个方面,本申请提供了一种会话内容识别方法,包括:
获取会话文本,并将会话文本分割为至少一个目标会话片段;
将目标会话片段输入预设的会话类型识别模型,以对目标会话片段添加分类标签;
基于目标会话片段抽取出分类标签对应的目标事件。
可选地,将会话文本分割为至少一个目标会话片段包括以下方式中的至少之一:
确定会话文本中各条消息的发送时间戳;在相邻两条消息的发送时间戳的时间间隔大于或等于第一阈值的情况下,在相邻两条消息处进行片段分割,其中,相邻两条消息被划分至不同的会话片段;
确定会话文本中各条消息的发送时间戳;按照各条消息的发送时间戳所在的时间区间对会话文本进行片段分割;
识别会话文本中的目标关键词,并将目标关键词作为会话片段的结尾对会话文本进行片段分割;
确定会话文本中的会话标识组,其中,会话标识组中包括相匹配的会话开始标识和会话结束标识,不同会话标识组中的标识不匹配;将同一组的会话开始标识至会话结束标识之间的会话消息作为目标会话片段进行分割。
可选地,基于目标会话片段抽取出分类标签对应的目标事件包括:
确定分类标签对应的代表句,其中,代表句为预先从具有相同分类标签的多个训练语料中提取出来的,代表句用于表示分类标签对应的事件类型的事件特征;
将代表句作为特征句标签添加到目标会话片段;
按照特征句标签的预设事件模板,从目标会话片段中抽取代表句中的属性对应的元素,其中,属性包括人物属性、事件属性、位置属性以及时间属性;
按照特征句标签的形式,利用抽取出来的元素组成目标特征句作为事件标签添加到目标会话片段,其中,事件标签用于表示目标事件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略昭辉科技有限公司,未经北京明略昭辉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111268692.4/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法