[发明专利]一种AI语音速率调整方法、装置及电子设备有效
申请号: | 201910939380.8 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110619888B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 石文超;戴会杰;常富洋 | 申请(专利权)人: | 北京淇瑀信息科技有限公司 |
主分类号: | G10L21/043 | 分类号: | G10L21/043;G10L25/51;G10L15/22 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 乔东峰 |
地址: | 100012 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 ai 语音 速率 调整 方法 装置 电子设备 | ||
本发明公开了一种AI语音速率调整方法、装置及电子设备,所述方法包括:创建与不同AI语音风格相匹配的AI语音参数集;在所述语音参数集中查找与用户选择的AI语音风格相匹配的AI语音参数,并根据所述AI语音参数播放语音,处理对话应答;实时分析通话对象的语音参数与所述AI语音参数的差异值;将所述差异值与预设阈值进行比较;若所述差异值超过所述预设阈值,调整所述语音参数。本发明的AI语音速率调整方法,通过实时对比通话对象的语音参数与AI语音参数的差异值,当差异值大于预设阈值时,调整AI语音参数,从而保证通话对象的语速与机器人的语速相匹配。
技术领域
本发明涉及AI语音技术领域,具体而言,涉及一种AI语音速率调整方法、装置、电子设备及计算机可读介质。
背景技术
AI(人工智能,Artificial Intelligence)语音技术近几年发展迅速,各大智能设备均以搭载智能语音AI技术为卖点,人们越来越来渴望可以自然便捷地与机器进行交流,从传统的一问一答的语音交互系统到目前较流行的多轮问答的语音交互系统,AI交互越来越接近人人交互,在用户体验上有了很大的提升。
然而通过各种技术手段合成的AI语音播放速率通常是固定不变的,在实际应用场景中,不同人对于AI语音的响应速度,间隔长短,语音速度感受不完全一致。这就导致在人机对话过程中,有的用户感觉机器人语速太快,或者每句话之间的间隔时间太短,或者机器人的反应速度太快,而有些用户感觉机器人语速太慢,或者每句话之间的间隔时间太长,或者机器人的反应速度太慢。在一种极端情况中可能会出现用户插不上话或机器人不能正常应答,导致对话无法正常进行的情况,影响用户体验。
发明内容
本发明旨在解决现有技术中AI语音播放速率固定,无法适应不同用户对话语速的技术问题。
为了解决上述技术问题,本发明第一方面提出一种AI语音速率调整方法,所述方法包括:
创建与不同AI语音风格相匹配的AI语音参数集;
在所述语音参数集中查找与用户选择的AI语音风格相匹配的AI语音参数,并根据所述AI语音参数播放语音,处理对话应答;
实时分析通话对象的语音参数与所述AI语音参数的差异值;
将所述差异值与预设阈值进行比较;
若所述差异值超过所述预设阈值,调整所述语音参数。
根据本发明一种较佳的实施方式,所述方法还包括:
创建语音调整模型,若所述差异值超过所述预设阈值,根据所述语音调整模型调整所述语音参数。
根据本发明一种较佳的实施方式,所述方法还包括:
对比当前通话对象的语音参数与当前AI语音参数得到第一结果,对比调整语音参数前通话对象的语音参数和调整语音参数后通话对象的语音参数得到第二结果。
根据所述第一结果和第二结果确定本轮参数调整方向;
根据本轮参数调整方向确定下轮参数调整方案。
根据本发明一种较佳的实施方式,若所述通话对象的语音速率大于第一预设速率,或者,所述通话对象的语音速率小于第二预设速率,在对话中插入常用口语助词。
根据本发明一种较佳的实施方式,所述语音参数包括:语音间隔时间、响应速度和语音速度。
根据本发明一种较佳的实施方式,所述调整方案包括不调整,与本轮参数调整方向相同继续调整或与本轮参数调整方向相反继续调整。
为解决上述技术问题,本发明第二方面提供一种AI语音速率调整装置,所述装置包括:
第一创建模块,用于创建与不同AI语音风格相匹配的AI语音参数集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京淇瑀信息科技有限公司,未经北京淇瑀信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910939380.8/2.html,转载请声明来源钻瓜专利网。