[发明专利]语音识别方法和装置有效
申请号: | 202110390219.7 | 申请日: | 2021-04-12 |
公开(公告)号: | CN113223516B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 张辽;赵银楼;蒋正翔;付晓寅;魏玮 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/01;G10L15/06;G10L15/26 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
1.一种语音识别方法,包括:
获取语音识别模型针对待识别语音输出的识别得分排在前N个的候选识别结果,所述N为大于1的正整数;
基于候选识别结果与预先收集的热门实体的发音相似度,分别对所述N个候选识别结果进行打分,得到各候选识别结果的相似度得分;
综合所述候选识别结果的识别得分和相似度得分,从所述N个候选识别结果中确定所述待识别语音对应的识别结果;其中,
预先基于流量统计热门实体,生成热门实体列表;
将所述热门实体列表以树结构进行存储,得到实体资源树;其中,所述实体资源树中的节点为热门实体中的字,节点之间的边为字之间的顺序关系,在所述实体资源树上标注有各节点的发音,所标注的各节点的发音用于对候选识别结果进行相似度打分;
其中,所述基于候选识别结果与预先收集的热门实体的发音相似度,分别对所述N个候选识别结果进行打分,得到各候选识别结果的相似度得分包括:
针对所述N个候选识别结果分别执行:将候选识别结果在实体资源模糊树上进行匹配;其中,所述实体资源模糊树通过在所述实体资源树上扩展标注各节点的相似发音得到。
2.根据权利要求1所述的方法,还包括:
加载所述实体资源树并作用于预设范围内用户的语音识别。
3.根据权利要求1所述的方法,其中,所述基于候选识别结果与预先收集的热门实体的发音相似度,分别对所述N个候选识别结果进行打分,得到各候选识别结果的相似度得分包括:
针对所述N个候选识别结果分别执行:利用相似度计算模型计算候选识别结果与各热门实体的发音相似度的最大值,基于该最大值确定该候选识别结果的相似度得分。
4.根据权利要求1所述的方法,其中,所述针对所述N个候选识别结果分别执行:将候选识别结果在实体资源模糊树上进行匹配之后,包括:
若能够匹配,则利用相似度计算模型计算该候选识别结果与匹配得到的热门实体的发音相似度的最大值,基于该最大值确定该候选识别结果的相似度得分,否则,确定该候选识别结果的相似度得分为0。
5.根据权利要求1所述的方法,其中,所述综合所述候选识别结果的识别得分和相似度得分,从所述N个候选识别结果中确定所述待识别语音对应的识别结果包括:
将所述候选识别结果的识别得分和相似度得分进行加权求和,得到所述N个候选识别结果的最终得分;
利用所述最终得分确定所述待识别语音对应的识别结果。
6.根据权利要求1至5中任一项所述的方法,其中,所述热门实体包括:基于流量统计得到的热门兴趣点POI或热门地点。
7.一种语音识别装置,包括:
候选获取单元,用于获取语音识别模型针对待识别语音输出的识别得分排在前N个的候选识别结果,所述N为大于1的正整数;
相似度打分单元,用于基于候选识别结果与预先收集的热门实体的发音相似度,分别对所述N个候选识别结果进行打分,得到各候选识别结果的相似度得分;
结果确定单元,用于综合所述候选识别结果的识别得分和相似度得分,从所述N个候选识别结果中确定所述待识别语音对应的识别结果;
实体统计单元,用于预先基于流量统计所述热门实体,生成热门实体列表;
资源存储单元,用于将所述热门实体列表以树结构进行存储,得到实体资源树;其中,所述实体资源树中的节点为热门实体中的字,节点之间的边为字之间的顺序关系,在所述实体资源树上标注有各节点的发音,所标注的各节点的发音用于对候选识别结果进行相似度打分;
所述相似度打分单元,具体用于针对所述N个候选识别结果分别执行:
将候选识别结果在实体资源模糊树上进行匹配;其中,所述实体资源模糊树通过在所述实体资源树上扩展标注各节点的相似发音得到。
8.根据权利要求7所述的装置,还包括:
资源加载单元,用于加载所述实体资源树并作用于预设范围内用户的语音识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110390219.7/1.html,转载请声明来源钻瓜专利网。