[发明专利]识别带口音的语音在审
申请号: | 202111143050.1 | 申请日: | 2014-01-24 |
公开(公告)号: | CN113793603A | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | K·A·格雷 | 申请(专利权)人: | 谷歌技术控股有限责任公司 |
主分类号: | G10L15/187 | 分类号: | G10L15/187;G10L15/26;G10L15/22 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李宝泉;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 口音 语音 | ||
1.一种方法,包括:
在数据处理硬件处接收由计算设备捕获的话语的音频数据;
由所述数据处理硬件基于所述话语的音频数据内的音调或语调来识别所述话语的说话者的母语;
基于所识别的所述话语的说话者的母语,由所述数据处理硬件为特定语言选择包括词语的发音的音素的口音库;以及
由所述数据处理硬件使用通过所选择的口音库修改的语音识别引擎来生成所述话语的转录。
2.根据权利要求1所述的方法,进一步包括由所述数据处理硬件提供所述话语的转录以用于输出。
3.根据权利要求1所述的方法,其中:
所述口音库是从均与特定语言内存在的不同的口音相关联的多个口音库中选择的;以及
所述话语的说话者说出所述特定语言作为第二语言。
4.根据权利要求1所述的方法,进一步包括:
由所述数据处理硬件基于与所述计算设备的用户交互来获得设备个性化数据,
其中,识别所述话语的说话者的母语进一步基于所述设备个性化数据。
5.根据权利要求4所述的方法,其中,所述设备个性化数据包括上下文应用信息。
6.根据权利要求1所述的方法,进一步包括:
由所述数据处理硬件确定所述话语的说话者的人口统计特征数据,
其中,识别所述话语的说话者的母语进一步基于所述话语的说话者的人口统计特征数据。
7.根据权利要求6所述的方法,其中,所述说话者的人口统计特征数据包括所述说话者所位于的地理位置。
8.根据权利要求6所述的方法,其中,所述说话者的人口统计特征数据是基于接收所述话语的计算设备的地址簿中存储的地址的国家。
9.根据权利要求1所述的方法,进一步包括:
由所述数据处理硬件确定所述话语的转录的准确度水平;以及
基于所述话语的转录的准确度水平,选择一个或多个附加的口音库,
其中,在生成所述话语的转录时,所述语音识别引擎进一步通过所选择的一个或多个附加的口音库被修改。
10.根据权利要求9所述的方法,其中,随着所述转录的准确度水平增加,所选择的附加的口音库的数目增加。
11.一种系统,包括:
数据处理硬件;以及
与所述数据处理硬件通信并且存储有指令的存储器硬件,所述指令在所述数据处理硬件上执行时使得所述数据处理硬件执行操作,所述操作包括:
接收由计算设备捕获的话语的音频数据;
基于所述话语的音频数据内的音调或语调来识别所述话语的说话者的母语;
基于所识别的所述话语的说话者的母语,为特定语言选择包括词语的发音的音素的口音库;以及
使用通过所选择的口音库修改的语音识别引擎来生成所述话语的转录。
12.根据权利要求11所述的系统,其中,所述操作进一步包括提供所述话语的转录以用于输出。
13.根据权利要求11所述的系统,其中:
所述口音库是从均与特定语言内存在的不同的口音相关联的多个口音库中选择的;以及
所述话语的说话者说出所述特定语言作为第二语言。
14.根据权利要求11所述的系统,其中,所述操作进一步包括:
基于与所述计算设备的用户交互来获得设备个性化数据,
其中,识别所述话语的说话者的母语进一步基于所述设备个性化数据。
15.根据权利要求14所述的系统,其中,所述设备个性化数据包括上下文应用信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌技术控股有限责任公司,未经谷歌技术控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111143050.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电动螺丝批的操作方法
- 下一篇:一种人造金刚石生产用石墨碳泥筛落分离装置