[发明专利]一种基于三元组的语音识别准确率计算方法有效
申请号: | 202110026253.6 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112349290B | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 杜沪;邵志明;宋琼;李科;郝玉峰;黄宇凯 | 申请(专利权)人: | 北京海天瑞声科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/69;G06F16/35;G06F40/205;G06F40/279;G06F40/30;G06N3/04 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李志新;刘亚平 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三元 语音 识别 准确率 计算方法 | ||
1.一种基于三元组的语音识别准确率计算方法,其特征在于,所述方法包括:
获取待识别语音及所述语音对应的正确文本;
识别所述语音,得到识别文本;
标注所述识别文本及所述正确文本;
解析标注的识别文本及所述正确文本,获得所述识别文本的三元组序列及所述正确文本的三元组序列;
根据所述识别文本的三元组序列及所述正确文本的三元组序列计算识别准确率。
2.根据权利要求1所述的基于三元组的语音识别准确率计算方法,其特征在于,通过三元组分类模型,标注所述识别文本及所述正确文本,其中,所述三元组分类模型通过以下训练方式得到:
设定所述三元组分类模型的类别;
根据所述三元组分类模型的类别特点,收集相应的训练文本;
对所述训练文本进行分词,标注每个词语的三元组类别,得到训练集;
根据所述训练集训练所述三元组分类模型。
3.根据权利要求2所述的基于三元组的语音识别准确率计算方法,其特征在于,所述三元组分类模型是BiLSTM-CRF模型。
4.根据权利要求1所述的基于三元组的语音识别准确率计算方法,其特征在于,解析所述标注的识别文本及所述正确文本,获得所述识别文本的三元组序列及所述正确文本的三元组序列,包括:
获取当前词语的标注类型;
根据所述标注类型,划分所述当前词语为一个或者多个词语单元,所述词语单元包括单元类型及词语值;
计算所述词语单元的权重,得到所述词语单元的三元组,所述三元组包括所述词语单元的单元类型,词语值及权重;
将所述标注的识别文本及正确文本的所有词语转换为三元组。
5.根据权利要求4所述的基于三元组的语音识别准确率计算方法,其特征在于,所述根据所述标注类型,划分所述当前词语为一个或者多个词语单元,包括:
根据所述标注类型,设置对应的词语单元,每个标注类型包括一个或多个词语单元;
通过正则表达式构建词语单元划分规则;
根据所述词语单元划分规则,将所述词语划分为词语单元。
6.根据权利要求4所述的基于三元组的语音识别准确率计算方法,其特征在于,所述计算所述词语单元的权重,包括:
设当前词语单元为Ui,j,其中,共设置M种标注类型,i为所述词语单元所属的标注类型编号,,j为第i种标注类型包含的总单元数;
获取所述词语单元Ui,j的权重为:
其中,所述词语单元包含的词语值总数为。
7.根据权利要求4所述的基于三元组的语音识别准确率计算方法,其特征在于,所述根据所述识别文本的三元组序列及所述正确文本的三元组序列计算识别准确率,包括:
通过动态规划算法,获取所述识别文本的三元组序列及所述正确文本的三元组序列的对齐关系;
根据所述对齐关系,获取所述识别文本的三元组序列的错误惩罚值;
根据所述错误惩罚值,计算所述识别文本的识别准确率。
8.根据权利要求7所述的基于三元组的语音识别准确率计算方法,其特征在于,所述获取所述识别文本的三元组序列及所述正确文本的三元组序列的对齐关系,包括:
获取所述识别文本的三元组及所述正确文本的三元组;
若所述识别文本的三元组的单元类型和词语值均与所述正确文本的三元组的单元类型和词语值相等,则所述识别文本的三元组与所述正确文本的三元组相等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海天瑞声科技股份有限公司,未经北京海天瑞声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110026253.6/1.html,转载请声明来源钻瓜专利网。