[发明专利]对话内容挖掘方法和对话内容评估模型的生成方法有效
申请号: | 202210591004.6 | 申请日: | 2022-05-27 |
公开(公告)号: | CN114969195B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 刘坤;刘凯 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F16/332;G06F40/35;G06F18/23;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗岚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 内容 挖掘 方法 评估 模型 生成 | ||
本公开提供了对话内容挖掘方法和对话内容评估模型的生成方法,涉及人工智能技术领域,尤其涉及深度学习、数据处理、自然语言处理等领域。具体实现方案为:获取包括平台对话内容的待挖掘对话对应的用户画像和产品画像,将待挖掘对话切分为多个类型的语义单元,根据同一类型的语义单元中的平台对话内容的意图、用户画像和产品画像对平台对话内容进行聚类以生成聚类平台对话内容,并和对话内容评估模型确定目标对话内容。本公开通过对平台对话内容进行聚类以生成聚类平台对话内容并和对话内容评估模型确定目标对话内容,减少了时间和人力成本,提高了对话内容挖掘结果的准确度,增强了对实际应用场景的适应性,从而提高了工作效率。
技术领域
本公开涉及人工智能技术领域中的深度学习、数据处理、自然语言处理等领域,尤其涉及一种对话内容挖掘方法和对话内容评估模型的生成方法。
背景技术
目前,在对话内容挖掘场景中,通过将优秀专员的沟通录音通过针对产品行业沟通场景专门优化的ASR(Automatic Speech Recognition,自动语音识别技术)服务转写为文本,并且分离出录音中的专员讲话部分和客户讲话部分,借助专门的聚类算法,找出相似语义的句子,最后结合业务经验,总结出优秀专员的最佳实践对话内容。
但是,对话内容挖掘的过程花费的时间和人力成本较高,对话内容挖掘结果的准确度一般,对实际应用场景的适用性不高,从而导致工作效率较低。
发明内容
本公开提供了一种对话内容挖掘和对话内容评估模型的生成方法、装置、电子设备及存储介质。
根据第一方面,提供了一种对话内容挖掘方法,包括:获取待挖掘对话,所述待挖掘对话中包括平台对话内容;获取所述待挖掘对话对应的用户画像和产品画像;将所述待挖掘对话切分为多个类型的语义单元;根据同一类型的所述语义单元中的平台对话内容的意图、所述用户画像和产品画像对所述平台对话内容进行聚类,以生成聚类平台对话内容;以及根据所述聚类平台对话内容和对话内容评估模型确定所述聚类平台对话内容中的目标对话内容。
根据第二方面,提供了一种对话内容评估模型的生成方法,包括:获取样本对话,所述样本对话中包括平台对话内容;获取所述样本对话对应的用户画像和产品画像;将所述样本对话切分为多个类型的语义单元;根据同一类型的所述语义单元中的平台对话内容的意图、所述用户画像和产品画像对所述平台对话内容进行聚类,以生成聚类平台对话内容;以及根据所述聚类平台对话内容和所述聚类平台对话内容的实际对话内容评估结果对待训练的对话内容评估模型进行训练,以生成对话内容评估模型。
根据第三方面,提供了一种对话内容挖掘装置,包括:第一获取模块,用于获取待挖掘对话,所述待挖掘对话中包括平台对话内容;第二获取模块,用于获取所述待挖掘对话对应的用户画像和产品画像;第一切分模块,用于将所述待挖掘对话切分为多个类型的语义单元;第一聚类模块,用于根据同一类型的所述语义单元中的平台对话内容的意图、所述用户画像和产品画像对所述平台对话内容进行聚类,以生成聚类平台对话内容;以及确定模块,用于根据所述聚类平台对话内容和对话内容评估模型确定所述聚类平台对话内容中的目标对话内容。
根据第四方面,提供了一种对话内容评估模型的生成装置,包括:第三获取模块,用于获取样本对话,所述样本对话中包括平台对话内容;第四获取模块,用于获取所述样本对话对应的用户画像和产品画像;第二切分模块,用于将所述样本对话切分为多个类型的语义单元;第二聚类模块,用于根据同一类型的所述语义单元中的平台对话内容的意图、所述用户画像和产品画像对所述平台对话内容进行聚类,以生成聚类平台对话内容;以及训练模块,用于根据所述聚类平台对话内容和所述聚类平台对话内容的实际对话内容评估结果对待训练的对话内容评估模型进行训练,以生成对话内容评估模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210591004.6/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法