[发明专利]网络电话语音识别方法、装置、计算机设备和存储介质有效
申请号: | 201710769327.9 | 申请日: | 2017-08-31 |
公开(公告)号: | CN107578770B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 岑敏强 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L17/02;G10L17/22 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络电话 语音 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种网络电话语音识别方法,其特征在于,所述方法包括:
确定网络电话语音的能量断句概率,并基于所述能量断句概率确定所述网络电话语音中的候选断句点;
确定所述候选断句点前后时刻的网络电话语音属于不同说话人的概率;
将所述候选断句点的能量断句概率和所述不同说话人的概率相乘得到所述候选断句点的语音断句概率;
基于所述候选断句点的语音断句概率对所述候选断句点进行筛选,并依据筛选结果对所述网络电话语音进行断句处理得到所述网络电话语音中包含的语音分句。
2.根据权利要求1所述的方法,其特征在于,在依据筛选结果对所述网络电话语音进行断句处理得到所述网络电话语音中包含的语音分句之后,还包括:
依据预设的语音单句长度阈值从所述语音分句中筛选出单人长分句;
依据所述单人长分句中包含的候选断句点对所述单人长分句进行断句修正处理。
3.根据权利要求2所述的方法,其特征在于,所述依据所述单人长分句中包含的候选断句点对所述单人长分句进行断句修正处理,包括:
根据所述候选断句点对所述单人长分句进行断句处理得到候选分句;
顺序遍历所述单人长分句中包含的候选分句,若任一候选分句的长度与所述语音单句长度阈值之间差值大于预设值,则将所述任一候选分句与位于所述任一候选分句之后的相邻候选分句融合得到新的候选分句;
重新执行候选分句遍历操作,直至存在候选分句的长度与所述语音单句长度阈值之间差值小于或等于预设值。
4.根据权利要求2所述的方法,其特征在于,所述依据所述单人长分句中包含的候选断句点对所述单人长分句进行断句修正处理,包括:
针对所述单人长分句中包含的每一候选断句点,将该候选断句点前后的候选分句融合得到新的候选分句;
选择长度最接近所述语音单句长度阈值的新的候选分句,并依据选择的新的候选分句对所述单人长分句作断句处理。
5.一种网络电话语音识别装置,其特征在于,所述装置包括:
候选断句点获取模块,用于确定网络电话语音的能量断句概率,并基于所述能量断句概率确定所述网络电话语音中的候选断句点;
语音归属检测模块,用于确定所述候选断句点前后时刻的网络电话语音属于不同说话人的概率;
语音断句概率确定模块,用于将所述候选断句点的能量断句概率和所述不同说话人的概率相乘得到所述候选断句点的语音断句概率;
语音断句处理模块,基于所述候选断句点的语音断句概率对所述候选断句点进行筛选,并依据筛选结果对所述网络电话语音进行断句处理得到所述网络电话语音中包含的语音分句。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
语音单人长分句获取模块,用于依据预设的语音单句长度阈值从所述语音分句中筛选出单人长分句;
语音单人长分句断句修正模块,用于依据所述单人长分句中包含的候选断句点对所述单人长分句进行断句修正处理。
7.根据权利要求6所述的装置,其特征在于,所述语音单人长分句断句修正模块,包括:
候选分句获取单元,用于根据所述候选断句点对所述单人长分句进行断句处理得到候选分句;
候选分句融合单元,用于顺序遍历所述单人长分句中包含的候选分句,若任一候选分句的长度与所述语音单句长度阈值之间差值大于预设值,则将所述任一候选分句与位于所述任一候选分句之后的相邻候选分句融合得到新的候选分句;
融合判断循环单元,用于重新执行候选分句遍历操作,直至存在候选分句的长度与所述语音单句长度阈值之间差值小于或等于预设值。
8.根据权利要求6所述的装置,其特征在于,所述语音单人长分句断句修正模块,包括:
候选分句组合单元,用于针对所述单人长分句中包含的每一候选断句点,将该候选断句点前后的候选分句融合得到新的候选分句;
候选分句筛选单元,用于选择长度最接近所述语音单句长度阈值的新的候选分句,并依据选择的新的候选分句对所述单人长分句作断句处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710769327.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音数据标注方法和装置
- 下一篇:语音识别方法及装置、存储介质、电子设备