[发明专利]基于人声分离的客服服务质检方法、系统、设备及介质在审
申请号: | 202011396382.6 | 申请日: | 2020-12-03 |
公开(公告)号: | CN112562644A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 刘露婕;王鸣 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26;G10L25/60 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人声 分离 客服 服务 质检 方法 系统 设备 介质 | ||
本发明涉及一种基于人声分离的客服服务质检方法、系统、设备及介质,该方法包括:采集客服与客户的通话录音;采用预先训练的降噪网络模型对所述通话录音进行人声分离,得到所述通话录音中客服的第一音频文件以及最大匹配度;若所述匹配度高于预设阈值,则根据所述第一音频文件对所述最大匹配度对应的客服的服务进行质检。本发明能够对通话录音进行人声分离,仅保留需要质检的客服的声音,排除了不需要质检的客户的声音,并给出了客服的匹配度以便进一步确认客服的身份,大大降低了质检人员的工作负担。
技术领域
本发明涉及声音识别领域,具体涉及一种基于人声分离的客服服务质检方法、系统、设备及介质。
背景技术
在通话场景中,至少有两人参与对话,在一些业务场景中,有将不同说话人区分并且识别其说话内容,并进一步进行话术分析的需求,但受技术限制,待识别和分离的语音有时会保存在同一个通道中或者在一个嘈杂环境中会同时收到多个人的语音,给进一步从混杂了多个说话人的语音中识别目标说话人的语音并进行话术分析造成困难,也就是所谓的“鸡尾酒会问题”。
目前在售楼处及其他电话销售场景,为保证客服话术的精准和专业,需要对客服的通话录音进行人工质检,在人工质检过程中,由于可能存在录音文件标记的客服与实际情况不对应的情况,需要质检人员辨认通话录音对应的客服,并且,由于通话录音除包含了需要质检的客服的声音之外,还包含了不需要质检的客户的声音,给质检人员带来了额外的工作负担。
发明内容
本发明提供一种基于人声分离的客服服务质检方法、系统、设备及介质,能够解决上述的技术问题。
本发明解决上述技术问题的技术方案如下:
一种基于人声分离的客服服务质检方法,包括:
采集客服与客户的通话录音;
采用预先训练的降噪网络模型对所述通话录音进行人声分离,得到所述通话录音中客服的第一音频文件以及最大匹配度;
若所述匹配度高于预设阈值,则根据所述第一音频文件对所述最大匹配度对应的客服的服务进行质检。
进一步,所述采用预先训练的降噪网络模型对所述通话录音进行人声分离,得到所述通话录音中客服的第一音频文件以及最大匹配度,具体包括:
采用预先训练的声纹特征模型提取全体客服的原始音频中的声音特征;
将所述声音特征和所述通话录音输入预先训练的降噪网络模型,分离得到所述通话录音中客服的第一音频文件以及最大匹配度。
上述进一步方案的有益效果是,通过采集声音特征与通话录音一并输入降噪网络模型,能够实现对通话录音中客服声音的自动提取,并给出识别出的最大匹配度及对应的客服。
进一步,所述根据所述第一音频文件对所述最大匹配度对应的客服的服务进行质检,具体包括:
将所述第一音频文件转写成文字并发送至显示设备进行展示,以便质检人员根据所述显示设备展示的文字对所述最大匹配度对应的客服的服务进行质检。
上述进一步方案的有益效果是,通过将音频转换成文字以便于直观、方便地对客服的服务进行质检。
进一步,该方法还包括:
若所述最大匹配度低于预设阈值,则对所述第一音频文件进行人工标注,确定所述第一音频文件对应的客服。
上述进一步方案的有益效果是,对于匹配度低的音频文件,通过人工标注的方式来确定其对应的客服。
进一步,该方法还包括:
若所述最大匹配度低于预设阈值,则将所述最大匹配度对应的客服作为推荐结果;
对所述推荐结果是否准确进行人工确认;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011396382.6/2.html,转载请声明来源钻瓜专利网。