[发明专利]一种语音处理方法及系统有效
申请号: | 201510622499.4 | 申请日: | 2015-09-25 |
公开(公告)号: | CN105336329B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 王少敏;雷闪耀;王洪 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L13/02;G10L25/48 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 古利兰;王宝筠 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 系统 | ||
1.一种语音处理方法,其特征在于,所述方法包括:
利用声音采集装置采集初始语音信息,构成第一音频信息;
对所述第一音频信息进行语音识别,转换得到相应的文字信息;
确定语音转换的属性;
依据所述文字信息和语音转换的属性从预置的语音数据资源中提取与所述文字信息相对应的音频信息;
对所提取的与所述文字信息相对应的音频信息的播放场景进行分析,将所述播放场景的背景音效作为第三音频信息;
基于所述第三音频信息、以及与所述文字信息相对应的所述音频信息构建得到第二音频信息;
保存或者播放所述第二音频信息。
2.根据权利要求1所述的方法,其特征在于,所述依据所述文字信息和语音转换的属性从预置的语音数据资源中提取与所述文字信息相对应的音频信息,包括:
对所述文字信息按照词或短语划分为N个部分;
在预置的语音数据资源中,分别查找与所述N个部分中每一部分相对应的音频信息片段,得到N个音频信息;
拼接所述N个音频信息,得到所述与所述文字信息相对应的音频信息。
3.根据权利要求1所述的方法,其特征在于,所述依据所述文字信息和语音转换的属性从预置的语音数据资源中提取与所述文字信息相对应的音频信息,包括:
读取预置的语音数据资源的属性;
查找满足所述语音转换的属性的预置的语音数据资源的属性;
提取查找到的所述预置的语音数据资源中与所述文字信息相对应的音频信息。
4.根据权利要求1或2所述的方法,其特征在于,所述依据所述文字信息和语音转换的属性从预置的语音数据资源中提取与所述文字信息相对应的音频信息,包括:
在预置的语音数据资源中,查找出对所述文字信息按照词或短语所划分成的N个部分中的M个部分相匹配的音频信息;
分析所述M个部分的音频信息,得到音频处理规则;依照所述音频处理规则,对剩下的N-M个部分进行音频处理,得到处理后的N-M个音频信息;
将所述M个音频信息与处理后的N-M个音频信息进行组合,构成所述与所述文字信息相对应的音频信息。
5.根据权利要求1所述的方法,其特征在于,所述预置的语音数据资源包括:
音频数据资源;
和/或
包含有音频数据资源的视频数据资源。
6.根据权利要求5所述的方法,其特征在于,所述预置的语音数据资源的包括:
从所述视频数据资源中提取音频信息,得到包含所述音频信息的音频数据资源。
7.一种语音处理系统,其特征在于,包括:
语音采集单元,用于采集初始语音信息,构成第一音频信息;
语音识别单元,用于对所述第一音频信息进行语音识别,转换得到相应的文字信息;
确定单元,用于确定语音转换的属性;
提取单元,用于依据所述文字信息和语音转换的属性从预置的语音数据资源中提取与所述文字信息相对应的音频信息;
获取单元,用于对所提取的与所述文字信息相对应的音频信息的播放场景进行分析,将所述播放场景的背景音效作为第三音频信息;
构建单元,用于基于所述第三音频信息、以及与所述文字信息相对应的所述音频信息构建得到第二音频信息;
播放单元,用于播放所述第二音频信息;
和/或
保存单元,用于保存所述第二音频信息。
8.根据权利要求7所述的系统,其特征在于,所述提取单元包括:
划分单元,用于对所述文字信息按照词或短语划分为N个部分;
第一查找单元,用于在预置的语音数据资源中,分别查找与所述N个部分中每一部分相对应的音频信息片段,得到N个音频信息;
拼接单元,用于拼接所述N个音频信息,得到所述与所述文字信息相对应的音频信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510622499.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:磁头加载力测试设备
- 下一篇:显示设备的色彩校准方法及色彩校准系统