[发明专利]一种基于智能语音技术的话务数据分析方法在审
申请号: | 201910082522.3 | 申请日: | 2019-01-28 |
公开(公告)号: | CN111489754A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 张莉;田诺;王峰;黄秀彬;马永波;曾玲丽;王明珠;王思杰;王庆贤;王宏岩;徐景龙;徐强 | 申请(专利权)人: | 国家电网有限公司客户服务中心;北京中电普华信息技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/24;G10L25/30;G10L15/06 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营 |
地址: | 300306 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 智能 语音 技术 话务 数据 分析 方法 | ||
1.一种基于智能语音技术的话务数据分析方法,其特征在于,包括以下步骤:
A、从电话录音平台下载录音数据文件,利用语音转写平台将该录音数据文件转写为文本内容;
B、将所述文本内容进行句子切分,并计算每个句子的句向量;
C、基于标准化句向量模型对所述每个句子的句向量进行标准化训练,输出对应的标准化句子;
D、将所述标准化句子进行关键词提取,并根据提取的关键词生成话务数据分析报表。
2.根据权利要求1所述的方法,其特征在于,所述步骤A之前还包括:
将语料库中的各句子样本进行句向量计算,得到句向量样本集合;
将所述句向量样本集合中的每个句向量样本进行相似性计算;
利用神经网络算法对符合相似性阈值的复数个句向量进行标准化训练,建立标准化句向量模型。
3.根据权利要求2所述的方法,其特征在于,所述步骤C包括:
将所述每个句子的句向量与所述句向量样本集合中的各句向量样本进行相似性计算;
分别选择符合与该每个句子的句向量相似性阈值的句向量样本所对应的标准化句向量模型,对该每个句子的句向量进行标准化训练;
将训练生成的每个句子的标准句向量进行转化,输出对应的标准化句子。
4.根据权利要求3所述的方法,其特征在于,所述步骤C之后还包括:
将所述每个句子的句向量与对应的标准句向量上传到标准化句向量模型库,以对所述标准化句向量模型进行训练。
5.根据权利要求1所述的方法,其特征在于,所述语音转写平台包括语音识别模型,该语音识别模型包括声学模型和语言模型,分别对应于从语音文件中抽取的音频特征到音节概率的计算和音节到文字概率的计算;
所述语言模型采用N-Gram模型进行建模;
所述声学模型采用深度神经网络和隐马尔可夫模型进行建模。
6.根据权利要求1所述的方法,其特征在于,所述步骤A还包括:
对所述录音数据文件进行话者分离,生成客服的录音数据和用户的录音数据。
7.根据权利要求1所述的方法,其特征在于,所述步骤B之前还包括:
对所述文本内容进行无效词语或无效语句的过滤。
8.根据权利要求1所述的方法,其特征在于,所述话务数据分析报表包括:
用户诉求分析,根据预设的关键词提取规则,对用户的录音转化的文本内容进行关键词提取,以得到用户的诉求;
运营管理分析,根据输出的标准化句子,对客服的不符合标准的用语习惯进行标准化管理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司客户服务中心;北京中电普华信息技术有限公司,未经国家电网有限公司客户服务中心;北京中电普华信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910082522.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗脓毒症的多肽及其应用
- 下一篇:晾晒系统