[发明专利]基于人工智能的话题挖掘方法、装置及电子设备在审
申请号: | 202010350555.4 | 申请日: | 2020-04-28 |
公开(公告)号: | CN111553144A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 黄忆丁 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F40/258 | 分类号: | G06F40/258;G06F40/216;G06F40/289;G06F40/30;G06F16/338;G06F16/335;G10L15/26 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 孙强 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 话题 挖掘 方法 装置 电子设备 | ||
本发明公开了一种基于人工智能的话题挖掘方法、装置及电子设备,涉及自然语言处理领域,该方法包括:获取对话录音的对话语音数据;基于预设的语音转文本技术,获取所述对话语音数据对应的对话文本数据;获取关注话题数;将所述对话文本数据以及所述关注话题数输入预训练的主题模型LDA,获取所述LDA对所述对话文本数据聚合得到的所述关注话题数的关注话题;基于所述对话文本数据对各所述关注话题进行统计,获取各所述关注话题的分布,实现话题挖掘。该方法提高了话题挖掘的挖掘率。本发明还涉及区块链技术,所述对话文本数据存储于区块链中。
技术领域
本发明涉及人工智能的自然语言处理领域,特别是涉及基于人工智能的话题挖掘方法、装置及电子设备。
背景技术
在互联网技术飞速发展的今天,客户在接受商家服务的过程中,常常会与客服进行沟通。例如:向客服咨询商品的信息、向客服投诉物流速度过慢。为保证客服以高水平的沟通能力与客户进行沟通,就需要对审核客服与客户的沟通能力进行审核。具体,通过对客服与客户之间的沟通内容所涉及的话题进行挖掘——确认客服与客户在沟通时涉及了哪些话题、主要涉及的是哪些话题,从而管理人员能够根据挖掘出的话题对客服进行审核。
现有技术中,在进行话题挖掘时,只能够对预设的关注话题进行挖掘,若客服与客户在沟通过程中出现了新内容,则无法挖掘出该新内容对应的新话题,挖掘率较低。
发明内容
基于此,为解决相关技术中如何从技术层面上解决话题挖掘的挖掘率低所面临的技术问题,本发明提供了一种基于人工智能的话题挖掘方法、装置及电子设备。
第一方面,提供了一种基于人工智能的话题挖掘方法,包括:
获取对话录音的对话语音数据;
基于预设的语音转文本技术,获取所述对话语音数据对应的对话文本数据;
获取关注话题数;
将所述对话文本数据以及所述关注话题数输入预训练的主题模型LDA,获取所述LDA对所述对话文本数据聚合得到的所述关注话题数的关注话题;
基于所述对话文本数据对各所述关注话题进行统计,获取各所述关注话题的分布,实现话题挖掘。
在本公开的一示例性实施例中,获取对话录音的对话语音数据,包括:
获取预设时间段内的对话录音;
将所述对话录音按照双向音轨的方式进行拆分,分别获取所述对话录音中各对话用户对应的对话语音数据;
所述基于预设的语音转文本技术,获取所述对话语音数据对应的对话文本数据,包括:基于预设的语音转文本技术,分别获取所述各对话用户对应的对话语音数据所对应的对话文本数据。
在本公开的一示例性实施例中,获取关注话题数,包括:
获取所述对话录音对应的来源场景;
基于所述来源场景获取关注话题数。
在本公开的一示例性实施例中,获取关注话题数,包括:
获取所述对话录音中各对话用户的用户特征;
基于所述用户特征获取关注话题数。
在本公开的一示例性实施例中,所述对话文本数据存储于区块链中,基于所述对话文本数据对各所述关注话题进行统计,获取各所述关注话题的分布,包括:
针对每一所述关注话题,获取所述对话文本数据中的各词语分别与所述关注话题的关联得分,所述关联得分表征着对应词语与所述关注话题的关联紧密程度;
针对每一所述关注话题,基于所述对话文本数据中的各词语分别与所述关注话题的关联得分,获取所述关注话题的总得分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010350555.4/2.html,转载请声明来源钻瓜专利网。