[发明专利]音频的生成方法、装置和电子设备在审
申请号: | 202211247246.X | 申请日: | 2022-10-12 |
公开(公告)号: | CN115641842A | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 骆俊凯;李洁辰 | 申请(专利权)人: | 上海洛轲智能科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/18;G10L13/047;G10L13/04 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 董艳芳 |
地址: | 200438 上海市杨浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 生成 方法 装置 电子设备 | ||
本发明提供了一种音频的生成方法、装置和电子设备,包括:基于语音指令确定待回复音频文本内容;判断预设的离线音频文件中是否存在与待回复音频文本内容对应的目标离线音频文件;若存在,则播报目标离线音频文件;若不存在,则基于待回复音频文本内容和预设的离线音频文件生成对应的目标音频文件进行播报。本发明的方法中,预设了一些离线音频文件,若存在与待回复音频文本内容对应的目标离线音频文件,那么直接播报,若不存在目标离线音频文件,再基于待回复音频文本内容和预设的离线音频文件生成对应的目标音频文件进行播报,在一定程度上可以减少生成目标离线音频文件的时间,加快了用户响应速度,提高了用户体验。
技术领域
本发明涉及音频生成的技术领域,尤其是涉及一种音频的生成方法、装置和电子设备。
背景技术
随着汽车的智能化发展,越来越依赖智能助手进行自然的人机交互。例如,汽车语音控制得到了普遍的应用,具体的,通过车载语音助手,用户在车内不仅能够通过语音控制导航、音乐等汽车软件,而且能控制车窗、空调和灯光等汽车硬件设备。语音助手通过语音识别、语义理解用户发出的语音指令,进而车辆执行对应的操作,执行完成后,生成要反馈给用户的文本,语音助手再通过文本生成音频文件进行播报,以提示用户已完成相应的操作。
但是,对于上述人机交互的对话过程中,通过文本生成音频文件具有一定的耗时,增加了响应用户的时间,且生成的音频播报不够拟人化。
综上,现有的直接通过文本生成音频文件的方式存在耗时长、用户体验差的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种音频的生成方法、装置和电子设备,以缓解现有的直接通过文本生成音频文件的方式耗时长、用户体验差的技术问题。
第一方面,本发明实施例提供了一种音频的生成方法,包括:
获取用户发出的语音指令,并基于所述语音指令确定待回复音频文本内容;
判断预设的离线音频文件中是否存在与所述待回复音频文本内容对应的目标离线音频文件;
若存在,则播报所述目标离线音频文件;
若不存在,则基于所述待回复音频文本内容和所述预设的离线音频文件生成对应的目标音频文件进行播报。
进一步的,若所述语音指令为语音控制指令,基于所述语音指令确定待回复音频文本内容,包括:
对所述语音控制指令进行语音识别,得到语音控制文本内容;
对所述语音控制文本内容进行语义理解,得到对应的控制操作,并执行所述控制操作;
根据所述控制操作的执行结果确定所述待回复音频文本内容。
进一步的,判断预设的离线音频文件中是否存在与所述待回复音频文本内容对应的目标离线音频文件,包括:
在预设散列表中确定是否存在所述待回复音频文本内容,其中,所述预设散列表为音频文本内容与所述音频文本内容对应的离线音频文件的存储路径之间的对应关系;
若存在,则确定所述预设的离线音频文件中存在与所述待回复音频文本内容对应的目标离线音频文件,并根据所述预设散列表中与所述待回复音频文本内容对应的目标存储路径获取所述目标离线音频文件;
若不存在,则确定所述预设的离线音频文件中不存在与所述待回复音频文本内容对应的目标离线音频文件。
进一步的,基于所述待回复音频文本内容和所述预设的离线音频文件生成对应的目标音频文件进行播报,包括:
对所述待回复音频文本内容进行拆分,得到至少两个待回复子音频文本内容;
判断所述预设的离线音频文件中是否存在与各所述待回复子音频文本内容对应的目标子离线音频文件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海洛轲智能科技有限公司,未经上海洛轲智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211247246.X/2.html,转载请声明来源钻瓜专利网。