[发明专利]一种语音识别的方法、语音断句的方法及装置有效
申请号: | 201810872121.3 | 申请日: | 2018-08-02 |
公开(公告)号: | CN110164420B | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 陈联武;白晶亮;罗敏 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/26 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 断句 装置 | ||
1.一种语音识别的方法,其特征在于,包括:
获取第一待处理语音信息;
根据所述第一待处理语音信息获取第一停顿时长;
若所述第一停顿时长大于或等于第一时长阈值,则对所述第一待处理语音信息进行语音识别,得到第一语音断句结果,其中,所述第一语音断句结果为文本信息;
根据所述第一语音断句结果和/或所述第一待处理语音信息确定第二时长阈值;
获取第二待处理语音信息,其中,所述第二待处理语音信息是在所述第一待处理语音信息之后获取的;
根据所述第二待处理语音信息获取第二停顿时长;
若所述第二停顿时长大于或等于所述第二时长阈值,则对所述第二待处理语音信息进行语音识别,得到第二语音断句结果,其中,所述第二语音断句结果为文本信息;
所述根据所述第一语音断句结果和/或所述第一待处理语音信息确定第二时长阈值包括:
根据所述第一语音断句结果的字数信息计算第二时长阈值,或者,根据所述第一待处理语音信息的时长信息计算第二时长阈值,或者,根据所述第一语音断句结果的字数信息以及所述第一待处理语音信息的时长信息计算第二时长阈值;
根据所述第一语音断句结果的字数信息计算第二时长阈值,包括:
获取文本字数以及目标单位时间;
根据第一时刻的语速、所述文本字数、所述目标单位时间以及平滑因子,计算第二时刻的语速,其中,所述第一时刻为所述第二时刻之前的一个时刻;
根据所述第二时刻的语速、预设语速范围以及第二预设语音时长,计算得到所述第二时长阈值;
根据所述第一待处理语音信息的时长信息计算第二时长阈值,包括:
根据所述第一待处理语音信息的语音起始时刻与语音结束时刻,计算所述目标语音时长;
根据所述目标语音时长、预设语音时长范围、第一预设语音时长以及最大语音时长,计算得到所述第二时长阈值;
根据所述第一语音断句结果的字数信息以及所述第一待处理语音信息的时长信息计算第二时长阈值,包括:
根据所述第一待处理语音信息的语音起始时刻与语音结束时刻,计算目标语音时长;
获取文本字数以及目标单位时间;
根据第一时刻的语速、所述文本字数、所述目标单位时间以及平滑因子,计算第二时刻的语速,其中,所述第一时刻为所述第二时刻之前的一个时刻;
根据所述目标语音时长、预设语音时长范围、预设语速范围、第三预设语音时长以及最大语音时长,计算得到所述第二时长阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810872121.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种老师与高中生之间单向语音系统
- 下一篇:语音解码方法、装置及存储介质