[发明专利]会话内容识别方法、装置、设备及计算机可读介质有效
申请号: | 202111268692.4 | 申请日: | 2021-10-29 |
公开(公告)号: | CN113705250B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 向宇;杨怡雯 | 申请(专利权)人: | 北京明略昭辉科技有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F16/35;G06F40/166 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 曾军 |
地址: | 100098 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 会话 内容 识别 方法 装置 设备 计算机 可读 介质 | ||
1.一种会话内容识别方法,其特征在于,包括:
获取会话文本,并将所述会话文本分割为至少一个目标会话片段;
将所述目标会话片段输入预设的会话类型识别模型,以对所述目标会话片段添加分类标签;
基于所述目标会话片段抽取出所述分类标签对应的目标事件;
抽取出所述分类标签对应的目标事件之后,所述方法还包括:
利用预设的突发事件判别模型分析具有相同所述分类标签的会话在时间变化基础上的数量变化特征;
根据所述数量变化特征确定所述目标事件的异常度;
在所述异常度处于异常度阈值范围之外的情况下,确定所述目标事件为突发事件;
按照各个所述突发事件的异常度的排序结果,生成突发事件排序列表,并将所述突发事件排序列表推送至目标终端进行展示。
2.根据权利要求1所述的方法,其特征在于,将所述会话文本分割为至少一个目标会话片段包括以下方式中的至少之一:
确定所述会话文本中各条消息的发送时间戳;在相邻两条消息的所述发送时间戳的时间间隔大于或等于第一阈值的情况下,在所述相邻两条消息处进行片段分割,其中,所述相邻两条消息被划分至不同的会话片段;
确定所述会话文本中各条消息的发送时间戳;按照各条消息的所述发送时间戳所在的时间区间对所述会话文本进行片段分割;
识别所述会话文本中的目标关键词,并将所述目标关键词作为会话片段的结尾对所述会话文本进行片段分割;
确定所述会话文本中的会话标识组,其中,所述会话标识组中包括相匹配的会话开始标识和会话结束标识,不同会话标识组中的标识不匹配;将同一组的所述会话开始标识至所述会话结束标识之间的会话消息作为所述目标会话片段进行分割。
3.根据权利要求1所述的方法,其特征在于,基于所述目标会话片段抽取出所述分类标签对应的目标事件包括:
确定所述分类标签对应的代表句,其中,所述代表句为预先从具有相同所述分类标签的多个训练语料中提取出来的,所述代表句用于表示所述分类标签对应的事件类型的事件特征;
将所述代表句作为特征句标签添加到所述目标会话片段;
按照所述特征句标签的预设事件模板,从所述目标会话片段中抽取所述代表句中的属性对应的元素,其中,所述属性包括人物属性、事件属性、位置属性以及时间属性;
按照所述特征句标签的形式,利用抽取出来的元素组成目标特征句作为事件标签添加到所述目标会话片段,其中,所述事件标签用于表示所述目标事件。
4.根据权利要求3所述的方法,其特征在于,确定所述分类标签对应的代表句之前,所述方法还包括按照如下方式从具有所述分类标签的多个训练语料中提取出所述代表句:
抽取所述多个训练语料中的句子,并确定各个句子与所述分类标签的相关度;
提取出与所述分类标签的相关度大于或等于第二阈值的句子作为核心句;
统计所述多个训练语料中所述核心句的出现次数,并按照所述出现次数对所有核心句进行排序;
选取排序结果中排名最高的所述核心句作为目标核心句;
将所述目标核心句作为所述代表句,并基于所述目标核心句创建所述预设事件模板。
5.根据权利要求3所述的方法,其特征在于,抽取出所述分类标签对应的目标事件之后,所述方法还包括:
利用预设的热门事件判别模型分析具有相同所述分类标签的会话在业务基础上的当前时段的数量特征;
根据所述数量特征确定所述目标事件的热度;
在所述热度大于或等于所述业务基础的热度阈值的情况下,确定所述目标事件为热门事件;
按照各个所述热门事件的热度的排序结果,生成热门事件排序列表,并将所述热门事件排序列表推送至目标终端进行展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略昭辉科技有限公司,未经北京明略昭辉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111268692.4/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法