[发明专利]一种语音转写方法及装置在审
申请号: | 202011569238.8 | 申请日: | 2020-12-26 |
公开(公告)号: | CN112687273A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 张志伟;雍文渊;汪冬雪;万欢;刘江 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 冯柳伟 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 转写 方法 装置 | ||
1.一种语音转写方法,其特征在于,所述方法包括:
获取第一当前声音信号;其中,所述第一当前声音信号是由第一声音采集设备在当前时刻下采集的;
根据所述第一当前声音信号,确定所述第一当前声音信号的声音能量;
在确定所述第一当前声音信号的声音能量高于所述第一当前声音信号对应的转写阈值时,对所述第一当前声音信号进行语音转写;其中,所述第一当前声音信号对应的转写阈值是根据第一历史声音信号的声音能量确定的;所述第一历史声音信号是由所述第一声音采集设备在第一历史时间段内采集的。
2.根据权利要求1所述的方法,其特征在于,当所述第一历史声音信号的个数为N时,所述第一当前声音信号对应的转写阈值的确定过程包括:
根据第1个第一历史声音信号的声音能量至第N个第一历史声音信号的声音能量,得到N个历史能量均值;其中,N为正整数;
将所述N个历史能量均值中最小值,确定为所述第一当前声音信号对应的转写阈值。
3.根据权利要求2所述的方法,其特征在于,当i为正整数,且i≤N时,第i个历史能量均值的确定过程包括:
若i=1,则根据第1个第一历史声音信号的声音能量,确定所述第i个历史能量均值;
若i≥2,则将第i个第一历史声音信号的声音能量和第i-1个历史能量均值进行加权求和,得到所述第i个历史能量均值。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第二历史声音信号的声音能量;其中,所述第二历史声音信号是由所述第一声音采集设备在第二历史时间段内采集的;
根据所述第二历史声音信号的声音能量,确定所述第一当前声音信号对应的历史能量变化趋势;
根据所述第一当前声音信号对应的历史能量变化趋势,确定所述第一当前声音信号对应的能量参考值;
所述对所述第一当前声音信号进行语音转写,包括:
在确定所述第一当前声音信号的声音能量高于所述第一当前声音信号对应的能量参考值时,对所述第一当前声音信号进行语音转写。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一当前声音信号对应的历史能量变化趋势,确定所述第一当前声音信号对应的能量参考值,包括:
在确定所述第一当前声音信号对应的历史能量变化趋势满足第一条件时,根据所述第一当前声音信号对应的历史能量变化趋势,确定所述第一当前声音信号对应的历史能量上升区段;
根据所述第一当前声音信号对应的历史能量上升区段,确定所述第一当前声音信号对应的能量参考值。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第二当前声音信号的声音能量;其中,所述第二当前声音信号是由所述第二声音采集设备在所述当前时刻下采集的;
在确定所述第二当前声音信号的声音能量高于所述第二当前声音信号对应的转写阈值时,根据所述第一当前声音信号的声音能量和所述第二当前声音信号的声音能量,确定所述第一当前声音信号对应的能量排序序号;其中,所述第二当前声音信号对应的转写阈值是根据所述第二声音采集设备在第一历史时间段内采集的声音信号的声音能量确定的;
所述对所述第一当前声音信号进行语音转写,包括:
在确定所述第一当前声音信号对应的能量排序序号满足第二条件时,对所述第一当前声音信号进行语音转写。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011569238.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种报文分类方法及装置
- 下一篇:一种乙烯基三丁酮肟基硅烷的精制方法