[发明专利]一种语音结束端点检测方法及装置在审
申请号: | 201910876235.X | 申请日: | 2019-09-17 |
公开(公告)号: | CN110689877A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 龙嘉裕 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L25/87;G10L15/26 |
代理公司: | 11291 北京同达信恒知识产权代理有限公司 | 代理人: | 宋正伟 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例提供一种语音结束端点检测方法及装置,其中方法包括:获取用户输入的语音信号,并将所述语音信号转换为文本信息;确定所述文本信息对应的语境类型,和/或所述语音信号中的非语言特征信息;根据所述语境类型和/或所述非语言特征信息确定检测时长;识别所述文本信息中的每个字在所述语音信号中对应的发音区间,当确定所述文本信息中的第一字的发音区间之后的所述检测时长内,不包括第二字的发音区间,则将所述第一字在所述语音信号中对应的发音区间的结束时间点作为第一端点;当确定所述第一字所处的句子的语义结构完整时,将第一端点作为所述第一字所处的句子在所述语音信号中的语音结束端点。 | ||
搜索关键词: | 发音区间 文本信息 语境类型 语言特征 时长 句子 语音 结束时间点 端点检测 信息确定 语义结构 语音信号 检测 转换 申请 | ||
【主权项】:
1.一种语音结束端点检测方法,其特征在于,包括:/n获取用户输入的语音信号,并将所述语音信号转换为文本信息;/n确定所述文本信息对应的语境类型,和/或所述语音信号中的非语言特征信息;/n根据所述语境类型和/或所述非语言特征信息确定检测时长;/n识别所述文本信息中的每个字在所述语音信号中对应的发音区间,当确定所述文本信息中的第一字的发音区间之后的所述检测时长内,不包括第二字的发音区间,则将所述第一字在所述语音信号中对应的发音区间的结束时间点作为第一端点;所述第一字为所述文本信息中的任一字,所述第二字位于所述第一字之后且与所述第一字相邻;/n当确定所述第一字所处的句子的语义结构完整时,将所述第一端点作为所述第一字所处的句子在所述语音信号中的语音结束端点。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910876235.X/,转载请声明来源钻瓜专利网。