[发明专利]有声播放装置及其播放方法在审
申请号: | 201811324524.0 | 申请日: | 2018-11-08 |
公开(公告)号: | CN111105776A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 邓广丰;蔡政宏;谷圳;朱志国;刘瀚文 | 申请(专利权)人: | 财团法人资讯工业策进会 |
主分类号: | G10L13/00 | 分类号: | G10L13/00;G10L13/08;G10L25/18;G10L25/63;G09F27/00 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 徐伟 |
地址: | 中国台湾台北市1*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 有声 播放 装置 及其 方法 | ||
1.一种有声播放装置,其特征在于,包含:
一存储器,用以存储一文本;
一输入装置,用以接收来自一用户的一第一指令;
一处理器,与该输入装置及该存储器电性连接,用以将该文本转换为一语音,其中该语音包含一目标角色语音;以及
一输出装置,与该处理器电性连接,用以输出该语音;
其中该处理器还用以:
根据该第一指令自多个声音模型中选择一目标声音模型,并将该目标声音模型指定于该文本中的一目标角色;以及
在将该文本转换为该语音的过程中,根据该目标声音模型将该文本中属于该目标角色的语句转换成该目标角色语音。
2.如权利要求1所述的有声播放装置,其特征在于:
该存储器还用以存储一预设数据,该预设数据用以记录该文本中的多个其他角色及该多个其他角色对应的多个其他声音模型,且该多个其他声音模型其中之一为该多个声音模型其中之一;以及
该处理器还用以在将该文本转换为该语音的过程中,根据该多个其他声音模型将该文本中属于该多个其他角色的语句转换成多个其他角色语音,且该语音包含该目标角色语音及该多个其他角色语音。
3.如权利要求1所述的有声播放装置,其特征在于,该多个声音模型的每一者是由该处理器或与该有声播放装置耦合的一云端服务器从一声音文件中萃取多个声音特征,并根据一特定性格而建立的,且该多个声音特征包含该声音文件的一音高特征、一语速特征以及一音频特征。
4.如权利要求3所述的有声播放装置,其特征在于,该声音文件是一真人录音文件。
5.如权利要求1所述的有声播放装置,其特征在于:
该输入装置还用以接收来自该用户的一第二指令;以及
该处理器还用以根据该第二指令,标记该多个声音模型的其中之一为一收藏声音模型。
6.如权利要求1所述的有声播放装置,其特征在于:
该输入装置还用以接收来自于该用户的一第三指令;以及
该输出装置还用以根据该第三指令播放该多个声音模型所各自转换出的多个试听声音文件,以让该用户基于该多个试听声音文件选择该多个声音模型中的其中一者作为该目标声音模型。
7.如权利要求1所述的有声播放装置,其特征在于,该多个声音模型中的每一个包含一音色子模型,且该音色子模型包含一音高参数、一语速参数以及一音频参数。
8.如权利要求7所述的有声播放装置,其特征在于,该多个声音模型中的每一个还包含一情绪子模型,且该处理器还用以根据该文本中的语句情绪,使用该情绪子模型调整该音色子模型,且该语句情绪包含疑问、开心、生气、难过。
9.如权利要求8所述的有声播放装置,其特征在于,该处理器还用以辨识该文本中的该目标角色以及属于该目标角色的语句中的语句情绪。
10.如权利要求9所述的有声播放装置,其特征在于,该目标角色的语句中的语句情绪是由该处理器根据该文本中的该目标角色的语句中的至少一情绪特征词而确认的。
11.一种用于一有声播放装置的播放方法,其特征在于,包含:
由该有声播放装置接收来自一用户的一第一指令;
由该有声播放装置根据该第一指令自多个声音模型中选择一目标声音模型,并将该目标声音模型指定于该文本中的一目标角色;
由该有声播放装置将一文本转换为一语音,其中该语音包含一目标角色语音;以及
由该有声播放装置输出该语音;
其中,在该有声播放装置将该文本转换为该语音的过程中还包含:
由该有声播放装置根据该目标声音模型将该文本中属于该目标角色的语句转换成该目标角色语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人资讯工业策进会,未经财团法人资讯工业策进会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811324524.0/1.html,转载请声明来源钻瓜专利网。