[发明专利]一种语音翻译方法和语音翻译设备有效
申请号: | 201810917296.1 | 申请日: | 2018-08-13 |
公开(公告)号: | CN109117484B | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 牛歌 | 申请(专利权)人: | 北京帝派智能科技有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G10L21/02 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100107 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户语音 语音信号 时间差 语音翻译设备 语音翻译 语音增强 两路 说话 译文 翻译 信号叠加 信号输出 语音能量 对齐 对话 申请 语音 输出 中断 工地 保证 交流 | ||
1.一种语音翻译方法,其特征在于,包括:
通过在翻译设备上分布设置的两个拾音单元采集包含用户语音成分的两路语音信号;
对两路所述语音信号进行用户语音成分对齐,以获取两路所述语音信号的时间差;
根据所述时间差,将两路所述语音信号进行信号对齐,并生成增强语音信号;
根据增强语音信号生成译文信号,所述译文信号包括译文语音信号和译文文本信号的至少一个;
所述根据时间差,将两路所述语音信号进行信号对齐,并生成增强语音信号,包括:
根据用户位置确定两个拾音单元中的近端拾音单元和远端拾音单元;所述近端拾音单元获取两路所述语音信号中的近端语音信号,所述远端拾音单元获取两路所述语音信号中的远端语音信号;
根据所述时间差,对所述远端语音信号向前移位修正,生成远端移位语音信号;
将所述远端移位语音信号与所述近端语音信号进行信号叠加,生成所述增强语音信号。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述时间差,对所述近端语音信号向后移位修正,生成近端移位语音信号;
使用所述近端移位语音信号抵消所述远端语音信号。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取信号对齐后的两路所述语音信号的相关度;
分析所述相关度是否低于预设阈值;
如果低于预设阈值,则重新获取所述时间差。
4.根据权利要求1所述的方法,其特征在于,当所述译文信号包括译文语音信号时,所述根据增强语音信号生成译文信号,包括:
使用预设的语种识别模型,获取所述增强语音信号对应的语种;
使用对应语种的语音识别模型将所述增强语音信号识别成待翻译文本;
将所述待翻译文本翻译成预设语种的译制文本;
根据所述译制文本生成译文语音信号,并将所述译文语音信号通过翻译设备的播放单元输出。
5.根据权利要求1所述的方法,其特征在于,还包括:
获取所述翻译设备的工作状态,所述工作状态包括语音激活状态和待机状态;
如果所述翻译设备处于待机状态,监测是否获取到语音激活信号;
如果获取到语音激活信号,将所述翻译设备的工作状态设置为语音激活状态。
6.根据权利要求5所述的方法,其特征在于,还包括:
如果所述翻译设备处于语音激活状态,分析两路所述语音信号是否在持续的预设时长内不包含用户语音成分;
如果不包含用户语音成分,将所述翻译设备的工作状态设置为待机状态。
7.根据权利要求4所述的方法,其特征在于,还包括:
分析所述增强语音信号识别得到的文本中是否包含预设指令文本;
如果包含所述预设指令文本,根据所述预设指令文本对所述翻译设备执行指令操作;
其中,所述指令操作至少包括中断所述播放单元的语音输出和改变所述翻译设备的输出语种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京帝派智能科技有限公司,未经北京帝派智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810917296.1/1.html,转载请声明来源钻瓜专利网。