[发明专利]具有自动语音转录的听力辅助在审
申请号: | 201780012197.2 | 申请日: | 2017-02-09 |
公开(公告)号: | CN108702580A | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | A·梅内泽斯;W·刘易斯;Y-M·王 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | H04R25/00 | 分类号: | H04R25/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;姚杰 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 文本 转录 听力设备 听力缺陷 文本转换 音频信号 自动语音 合成 听力受损用户 听力损失简档 语音识别引擎 文本到语音 背景噪声 辅助设备 合成话音 话音输出 听力受损 语音转换 语音转录 引擎 听力 话音 转换 | ||
本文描述的辅助听力设备实现通过以下方式来辅助设备的听力受损用户:使用自动语音转录来生成表示在音频信号中接收的语音的文本,文本然后可以被定制的合成话音读以克服用户的听力缺陷。语音识别引擎识别接收的音频中的语音并将接收的音频的语音转换为文本。一旦语音被转换为文本,文本到语音引擎就可以将文本转换为合成语音,该合成语音可以被增强并以话音输出,该话音补偿辅助听力设备的用户的听力损失简档。通过将所接收的语音转录成文本,本文描述的辅助听力设备实现消除了来自音频信号的背景噪声。通过将转录的文本转换为对听力受损者更容易理解的合成话音,他们的听力缺陷可以被弥补。
背景技术
传统助听器包括在用户身体上(通常在耳朵处或在耳朵附近)小心穿戴的麦克风、处理单元和在用户耳道入口内或入口处的扬声器。助听器的原理是捕获到达用户的音频信号并以克服用户听力能力的缺陷的方式放大它。例如,信号可以在某些频率上比其他频率更多地被放大。已知对人类理解语音很重要的某些频率可能比其他频率提升更多。
发明内容
提供本发明内容是为了以简化的形式介绍一些概念,这些概念将在下面的具体实施方式中被进一步描述。本发明内容不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。
通常,本文描述的辅助听力设备实现通过以下方式来辅助听力受损的用户:采用自动语音转录来生成表示在音频信号中接收的语音的文本,然后文本被显示给用户和/或以被定制的合成话音读以克服用户的听力缺陷。
在一些实现中,辅助听力设备实现使用麦克风或麦克风阵列(在一些情况下优化用于语音识别)来捕获包含语音的音频信号。语音识别引擎识别接收的音频中的语音(例如,词语),并将接收的音频的经识别的词语/语言分量转换为文本。一旦语音被转换为文本,文本可以被显示在现有设备上,诸如例如用户的电话、手表或计算机,或者可以被显示在可穿戴的增强现实显示器上,或者可以直接被投射到用户的视网膜。对于具有深度或完全听力损失的人来说,文本的视觉显示在非常嘈杂的情况下尤其有益,或者对于一些用户而言可以简单地是优选的。在其他实现中,文本到语音引擎(例如,语音合成器)可以将文本转换为合成语音,该合成语音可以被增强并以话音输出,该话音补偿辅助听力设备的用户的听力损失简档。在其他实现中,除了合成话音之外,还可以使用所识别文本的显示。文本可以在与扬声器或其他音频输出设备输出的合成语音协调或不协调的情况下被显示给用户。
本文描述的辅助听力设备实现可以在独立的专用设备上实现,或者在用户的移动计算设备(例如,智能电话、智能手表、智能眼镜等)上的应用或应用程序上实现。
本文描述的各种辅助听力设备实现可以将合成的(文本到语音)语音输出到放置在用户耳朵中或附近或者由用户以某种类似的方式穿戴的耳机或扬声器。在一些实现中,表示合成语音的信号可以直接发送到用户的传统助听器,或者可以直接被发送到用户的一个或多个人工耳蜗。
附图说明
关于以下描述、所附权利要求和附图,将更好地理解本公开的具体特征、方面和优点,在附图中:
图1是在其中可以实践本文描述的辅助听力设备实现的示例性环境。
图2是如本文描述的示例性辅助听力设备实现的功能框图。
图3是如本文描述的另一示例性辅助听力设备实现的功能框图,其可以提供对于听力受损者更容易理解的增强合成语音,并且以一种或多种语言显示与所接收的语音相对应的文本。
图4是用于如本文描述的示例性辅助听力设备实现的系统的功能框图,其中服务器或计算云可被用于共享处理,例如,语音识别和文本到语音处理。
图5是用于实践各种示例性辅助听力设备实现的示例性过程的流程图,该各种示例性辅助听力设备实现输出对特定用户的听力损失简档而定制的合成语音。
图6是用于实践将语音转录为文本并将转录的文本输出到显示器的各种示例性辅助听力设备实现的示例性过程的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780012197.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:扬声器
- 下一篇:用于测试耳机设备的方法和设备