[发明专利]水处理领域无专业语音数据条件下的语音命令识别方法有效
申请号: | 202011576504.X | 申请日: | 2020-12-28 |
公开(公告)号: | CN112786024B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 胡劲松;王钊越 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26;G10L25/30 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 水处理 领域 专业 语音 数据 条件下 命令 识别 方法 | ||
1.水处理领域无专业语音数据条件下的语音命令识别方法,其特征在于,包括以下步骤:
S1、语音转拼音:对用户语音进行语音分析、识别,并获得语音对应的整句拼音;
S2、拼音转文本:利用最长优先分级匹配法对步骤S1所得整句拼音进行中文文本匹配,从而获取用户语音对应的命令文本;其中,所述最长优先分级匹配法的步骤如下:
a、根据水处理领域专业词汇库中不同词汇的长度进行词汇分级;
b、为不同级别的词汇分配不同的基准评分Ci,该基准评分Ci的设置如下:
式中,β代表取值范围为[0.5,1]之间的放缩系数,n代表语音转拼音的准确率,其取值范围为[0,1],Hmax、Hmin代表最高和最低的词汇级别,Hi代表当前的词汇级别;
c、将步骤S1中获取得到的拼音定义为A0,对A0中每一个不同长度的拼音串Sj,分别利用杰卡德相似系数计算其与词汇库中对应级别所有词汇的相似度Pjk,将相似度Pjk与基准评分Ci相乘,得到拼音串Sj与所有对应级别词汇的实际匹配得分Tjk,公式化Tjk的计算过程如下:
Tjk=Pjk*Ci
式中,Tjk代表了拼音串Sj与词汇库中词汇对应的拼音Vk的实际匹配得分,Pjk代表通过杰卡德相似系数计算出来的拼音串Sj与词汇库中词汇对应的拼音Vk的相似度,Ci代表了与Sj对应的级别的基准评分;
d、将每一个拼音串Sj与其对应的最高实际匹配得分的词汇记录到一个词典D0中;
e、通过查询词典D0,取出A0所有拼音串中出现过的最高实际匹配得分,若该得分小于阈值,则抛弃A0,并结束所有流程;若该得分高于或等于阈值,则将最高实际匹配得分所对应的词汇替换掉对应位置上的拼音串,并进入步骤f;
f、利用步骤e中替代完成的词汇为中心,将A0划分为两个未匹配的部分,并记为A1和A2,将A1覆盖原来的A0,并重复步骤e、f直到A0为空,接着将A2覆盖原来的A0,再次重复步骤e、f直到A0为空。
2.根据权利要求1所述的水处理领域无专业语音数据条件下的语音命令识别方法,其特征在于,所述步骤S1包含以下步骤:
S11、获取语音;
S12、用梅尔频率倒谱系数特征提取方法提取步骤S11获取的语音的语音特征;
S13、利用VGG网络对步骤S12中获取的语音特征进行再处理,从而获得更高层次的特征;
S14、利用全连接神经网络将步骤S13中提取到的特征进行转化,从而得到神经网络的输出;
S15、使用集束搜索方法对步骤S14中得到的神经网络的输出进行处理,从而获得步骤S11中语音对应的拼音。
3.根据权利要求1所述的水处理领域无专业语音数据条件下的语音命令识别方法,其特征在于,所述水处理领域专业词汇库的构建过程如下:
a、调用本地存储设备,获取大量水处理领域的文本资料,包括专业文献、系统日志和通话文本;
b、对步骤a所采集的文本资料进行清理和分词操作,并获得词汇列表,接着对词汇列表进行词频统计,得到词频词典;
c、剔除词频词典中低于阈值的词汇,并对词频词典按照检查、修改、增加和删除的流程进行词典再处理;
d、为词频词典中每一个词汇关联其对应的拼音,最终形成水处理领域专业词汇库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011576504.X/1.html,转载请声明来源钻瓜专利网。