[发明专利]一种自动补充质检关键词表的方法、电子设备和存储介质有效
申请号: | 202010089159.0 | 申请日: | 2020-02-12 |
公开(公告)号: | CN111161707B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 聂镭;李睿;聂颖 | 申请(专利权)人: | 龙马智芯(珠海横琴)科技有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/06;G10L15/08;G10L15/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 519000 广东省珠海市横琴新区环岛*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 补充 质检 关键 词表 方法 电子设备 存储 介质 | ||
本发明公开了自动补充质检关键词表的方法,通过本发明,通过自动补充质检关键词表,也即将语音识别模型对质检关键词识别错误的识别文字作为该质检关键词的补充词,并将所述补充词加入所述质检关键词表,这样,当后续质检的时候,如果使用质检关键词匹配失败的时候,可以使用该质检关键词的补充词进行质检,可以在一定程度上改善因为语音识别模型对质检关键词的错误识别导致的质检效果差的问题。
技术领域
本发明涉及语音处理技术领域,特别是一种自动补充质检关键词表的方法、电子设备和存储介质。
背景技术
为提升服务质量和业绩,同时降低法律风险,银行、保险、电信等行业的呼叫中心或者客服中心会对坐席或者客户经理的客服工作、营销工作等业务场景的对话语音录音进行质检,以检验坐席或者客户经理的讲话内容和方式是否符合单位规定和要求。质检是指对保险行业的客服人员与客户的交流语音进行检查,并与给定话术脚本进行比对,判断是否有错说、漏说等违规现象。话术脚本一般就是固定的文本。通常,对给定的话术脚本中包含有多个质检项,因此要按照各个质检项一一检查。
当前比较热门的语音质检方法是基于人工智能技术的语音质检系统,其先经过语音识别将语音转换为文本,然后基于给定的话术脚本内容,进行文本匹配,从而得出是否合规的结论。这种质检方法的关键在于语音识别的效果情况,在语音识别的结果比较清晰,识别出的文字错误率低的情况下,能很好的针对话术脚本进行质检,然而,在现实场景下,语音识别的效果往往不太如意,识别错误率较高。在这种情况下,如何对语音识别准确率低的音频进行质检就变得极具挑战性。
发明内容
本发明实施例提出了一种自动补充质检关键词表的方法、电子设备和存储介质,以至少改善现有技术中对语音识别准确率低的音频进行质检效果差的问题。
根据本发明的一个实施例,提供了一种自动补充质检关键词表的方法,包括:
步骤一,将音频输入语音识别模型,得到音频的语音识别内容,其中,所述音频带有文字标注,所述文字标注为音频中语音对应的文本内容;
步骤二,从质检关键词表中获取第一质检关键词,并将所述第一质检关键词对所述语音识别内容进行匹配,得到第一匹配结果;
步骤三,判断所述第一匹配结果,如果所述第一匹配结果为匹配成功,则回到步骤二;如果所述第一匹配结果为匹配失败,则进入步骤四;
步骤四,获取所述第一质检关键词的拼音,并使用所述拼音对所述语音识别内容进行匹配,得到第二匹配结果;
步骤五,判断所述第二匹配结果,如果所述第二匹配结果为匹配成功,则将所述拼音在所述语音识别内容中对应的文字作为所述第一质检关键词的补充词,并将所述补充词加入所述质检关键词表。
如果所述第二匹配结果为匹配失败,则执行以下步骤:
步骤六,获取所述第一质检关键词在所述文字标注中的第一邻近词,将所述第一邻近词对所述语音识别内容进行匹配,得到第三匹配结果,其中,所述第一邻近词包括第一左邻近词和第一右邻近词;
步骤七,判断所述第三匹配结果,如果所述第三匹配结果为匹配成功,则将所述语音识别内容中所述第一邻近词之间的文字作为所述第一质检关键词的补充词,并将所述补充词加入所述质检关键词表。
进一步地,如果所述第三匹配结果为匹配失败,则执行以下步骤:
步骤八,获取所述第一邻近词的拼音,并使用所述拼音对所述语音识别内容进行匹配,得到第四匹配结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙马智芯(珠海横琴)科技有限公司,未经龙马智芯(珠海横琴)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010089159.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机械臂及其中药自动配药系统
- 下一篇:一种拉进机构及其中药自动配药系统