[发明专利]语音中的领域词的识别方法、系统、设备和介质在审

申请号：	202210278367.4	申请日：	2022-03-17
公开（公告）号：	CN114743551A	公开（公告）日：	2022-07-12
发明（设计）人：	陈文浩;罗超;邹宇;郝竹林;张启祥	申请（专利权）人：	携程旅游信息技术（上海）有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26;G10L15/08;G10L15/02;G10L15/16;G06F40/284
代理公司：	上海弼兴律师事务所 31283	代理人：	马涛;罗朗
地址：	201203 上海市浦东新***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音中的领域识别方法系统设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音中的领域词的识别方法、系统、设备及介质。该方法包括：将原始语音数据转换为原始文本数据；对原始文本数据进行预处理，生成候选新词数据；计算候选新词数据的自由度信息，确定第一领域词概率；根据原始语音数据对应的声学特征和原始文本数据对应的向量特征生成融合特征向量，并将融合特征向量输入序列预测模型中，输出第二领域词概率；根据第一领域词概率和第二领域词概率，确定原始语音数据所对应的领域词的概率值。本发明根据计算自由度信息而得到的第一领域词概率和利用序列预测模型计算得到的第二领域词概率共同确定领域词的概率值，改善了领域词识别的准确性，提高了预测的精度。

技术领域

本发明涉及语音识别技术领域，尤其涉及一种语音中的领域词的识别方法、系统、设备和介质。

背景技术

近年来，伴随着语音识别技术的不断发展，语音识别技术被运用在越来越多的场景中。然而，语音识别的场景中，因原始的语料库不足，导致缺乏很多领域词，造成词汇无法识别的情况。

现有技术中，通常将语音事先转写成文本形式再进行领域词判断。但是在语音转文字的过程中，会出现因翻译错误，造成后续的领域词判断产生误差积累的现象。

因此，随着应用场景的增多，用户对语音识别系统在不同领域上的领域词识别准确率的要求越来越高。

发明内容

本发明要解决的技术问题是为了克服现有技术中领域词的识别准确率低的缺陷，提供一种语音中的领域词的识别方法、系统、设备和介质。

本发明是通过下述技术方案来解决上述技术问题：

第一方面，本发明提供一种语音中的领域词的识别方法，所述识别方法包括：

将原始语音数据转换为原始文本数据；

对所述原始文本数据进行预处理，生成候选新词数据；

计算所述候选新词数据的自由度信息，确定第一领域词概率；

根据所述原始语音数据对应的声学特征和所述原始文本数据对应的向量特征生成融合特征向量，并将所述融合特征向量输入序列预测模型中，输出第二领域词概率；

基于所述第一领域词概率和所述第二领域词概率，确定所述原始语音数据所对应的领域词的概率值；

其中，所述序列预测模型是根据待训练的样本语音数据和标注后的样本语音数据基于循环神经网络训练而得到的，所述标柱后的样本语音数据的每一帧具有领域词标签或者非领域词标签。

较佳地，所述计算所述候选新词数据的自由度信息，确定第一领域词概率的步骤，包括：

确定所述候选新词数据的自由度衡量指标；

计算所述候选新词数据的凝聚度指标；

基于所述自由度衡量指标和所述凝聚度指标，计算出所述第一领域词概率。

较佳地，所述对所述原始文本数据进行预处理，生成候选新词数据的步骤，包括：

对所述原始文本数据进行分词处理，生成若干个原始词汇；

将所述原始词汇中的预设词频的词汇和语气词汇进行清洗，生成所述候选新词数据。

较佳地，所述基于所述第一领域词概率和所述第二领域词概率，确定所述原始语音数据所对应的成词概率的步骤，包括：

根据所述第一领域词概率和所述第二领域词概率的加权结果或者求和结果，计算得到所述领域词的概率值。

第二方面，本发明提供一种语音中的领域词的识别系统，所述识别系统包括：

转换模块，用于将原始语音数据转换为原始文本数据；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于携程旅游信息技术（上海）有限公司，未经携程旅游信息技术（上海）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210278367.4/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音中的领域词的识别方法、系统、设备和介质在审

专利文献下载