[发明专利]多角色语音的交互方法、电子设备和存储介质在审
申请号: | 202111649321.0 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114283820A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 宋泽;甘津瑞;陈铭竑;邓建凯 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/22;G10L15/18;G10L25/63 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;侯晓艳 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 角色 语音 交互 方法 电子设备 存储 介质 | ||
本发明公开一种多角色语音的交互方法、电子设备和存储介质,其中方法包括:通过本地用户端获取音频数据,将音频数据发送到远程端的语音识别服务器。语音识别服务器通过语义识别模型识别待识别文字数据获取语义识别结果信息。通过对话模型识别语义识别结果信息,获取对话结果信息及设定角色信息。语音识别服务器根据设定角色信息及对话信息合成回复语音且将发送到本地用户端。本地用户端播放回复语音。本发明支持多角色语音交互,根据用户的情绪状态,推荐适合的角色与之进行对话交流,占用资源较少,具有高可靠、高稳定的优点,自动切换角色功能,很大程度上提高了语音交互的趣味性,与目前市面上多角色交互方案相比,鲁棒性更好。
技术领域
本发明属于人工智能技术领域,尤其涉及一种多角色语音的交互方法、电子设备和存储介质。
背景技术
目前市面上有语音识别(Automatic Speech Recongnition,ASR)、自然语言处理(Natural Language Processing,NLP)、语音合成(Text To Speech, TTS),以及情绪识别Automatic Speech Emotion Recognition,ASER)等技术,提供语音交互的基础能力。
语音识别主要是将人所发出的语音内容转换为可供计算机读入的文本信息,其具有两种工作模式:识别模式和命令模式。语音识别程序的实现也会根据两种模式的不同而采用不同类型的程序。识别模式的工作原理是:引擎系统在后台直接给出一个词库和识别模板库,任何系统都不需要再进一步对识别语法进行改动,只需要根据识别引擎提供的主程序源代码进行改写就可以了。命令模式相对来说实现起来比较困难,词典必须要由程序员自己编写,然后再进行编程,最后还要根据语音词典进行处理和更正。识别模式与命令模式最大的不同就是,程序员要根据词典内容进行代码的核对与修改。
自然语言处理,是实现人机间自然语言通信的重要手段,其包括两个部分,自然语言理解(Natural Language Understanding,NLU)和自然语言生成(Natural LanguageGeneration,NLG),即能使计算机既能理解自然语言文本的意义,也能以自然语言文本来表达给定的意图、思想等。自然语言理解是建立一种计算机模型,自然语言理解以语言学为基础,融合逻辑学、心理学和计算机科学等学科,试图解决以下问题:语言究竟是怎样组织起来传输信息的?人又是怎样从一连串的语言符号中获取信息的?换种表达就是,通过语法、语义、语用的分析,获取自然语言的语义表示,理解自然语言文本所表达的意图。而自然语言生成是人工智能和计算语言学的分支,相应的语言生成系统是基于语言信息处理的计算机模型, 其工作过程与自然语言分析相反,是从抽象的概念层次开始,通过选择并执行一定的语义和语法规则来生成文本。
语音合成是一种可以将任意文本转换成相应语音的技术。传统的语音合成系统通常包括前端和后端两个模块。前端模块主要是对输入的文本进行分析,提取后端模块所需要的语言信息,一般包含文本正则化、分词、词性预测、多音字消歧、韵律预测等子模块。后端模块根据前端分析结果,通过一定的方法生成语音波形,一般分为基于统计参数建模的语音合成(或称参数合成)以及基于单元挑选和波形拼接的语音合成(或称拼接合成)。对于参数合成而言,该方法在训练阶段对语言声学特征、时长信息进行上下文相关建模,在合成阶段通过时长模型和声学模型预测声学特征参数,对声学特征参数做后处理,最终通过声码器恢复语音波形。该方法在语音库相对较小的情况下,具有较为稳定的合成效果,而缺点在于统计建模带来的声学特征参数“过平滑”问题,以及声码器对音质的损伤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111649321.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种腈水解酶突变体、工程菌及其应用
- 下一篇:一种储水装置温度检测方法