[发明专利]水处理领域无专业语音数据条件下的语音命令识别方法有效
申请号: | 202011576504.X | 申请日: | 2020-12-28 |
公开(公告)号: | CN112786024B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 胡劲松;王钊越 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26;G10L25/30 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 水处理 领域 专业 语音 数据 条件下 命令 识别 方法 | ||
本发明公开了一种水处理领域无专业语音数据条件下的语音命令识别方法,该方法将水处理领域的专业语音命令识别用简单的步骤实现:对用户语音进行语音分析、识别,并获得语音对应的整句拼音;利用最长优先分级匹配法对整句拼音进行中文文本匹配,从而获取所述用户语音对应的命令文本。本发明可以在无专用语音库供模型训练的前提下就获得高准确率的识别效果。此外,本发明提出的最长优先分级匹配法,可以进一步提高水处理领域中长词的匹配准确率,从而进一步提高语音命令的识别准确率,对实际使用有着重要的意义。
技术领域
本发明涉及水处理的技术领域,尤其是指一种水处理领域无专业语音数据条件下的语音命令识别方法。
背景技术
由于水处理专业领域语句的专业性、小众性,有大量的水处理专业词汇不会出现在通用语音库的语音中,这导致了在通用语音库上训练的传统的语音识别技术在水处理专业领域的准确率不佳。与此同时,按照传统方法,要提高专业领域语音命令的识别准确率,需要采集多个朗读者朗读的专业领域的专用语音,这涉及到大量的录制、采集、标注工作,需要耗费大量的时间、金钱和人力成本。
在水处理领域中,专业的命令语句短且规范。因此,虽然命令语句中包含了专业词汇,但词汇总量较少,构建出来的词汇库比通用词汇库小了很多。
与此同时,由于水处理专业词汇长短不一,有些长度只有两个,有些有五个。而在语音转拼音处理中,不可能达到100%的准确率,这也意味着对语音命令的拼音转化必定存在误差。当某个拼音串的长度增加时,该拼音串中存在识别错误的可能性也在不断提高。这一现状也意味着匹配到长词汇的难度比匹配到短词汇的难度更高,甚至可能存在一直匹配不到长词汇的情况。在目前的技术方案中,少有人关注到这一现状,并采用一些技术手段提高长词的匹配准确率。然而,在水处理领域中,长词一般都是命令中的一些关键词,这也意味着通过传统的技术方案识别出来的命令存在曲解的风险,可能会对后续的生产过程产生不利的影响。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种水处理领域无专业语音数据条件下的语音命令识别方法,可以在无专用语音库供模型训练的前提下就获得高准确率的识别效果,此外,该方法提出的最长优先分级匹配法,可以进一步提高水处理领域中长词的匹配准确率,从而进一步提高语音命令的识别准确率,对实际使用有着重要的意义。
为实现上述目的,本发明所提供的技术方案为:水处理领域无专业语音数据条件下的语音命令识别方法,包括以下步骤:
S1、语音转拼音:对用户语音进行语音分析、识别,并获得语音对应的整句拼音;
S2、拼音转文本:利用最长优先分级匹配法对步骤S1所得整句拼音进行中文文本匹配,从而获取用户语音对应的命令文本;其中,所述最长优先分级匹配法的步骤如下:
a、根据水处理领域专业词汇库中不同词汇的长度进行词汇分级;
b、为不同级别的词汇分配不同的基准评分Ci,该基准评分Ci的设置如下:
式中,β代表取值范围为[0.5,1]之间的放缩系数,n代表语音转拼音的准确率,其取值范围为[0,1],Hmax、Hmin代表最高和最低的词汇级别,Hi代表当前的词汇级别;
c、将步骤S1中获取得到的拼音定义为A0,对A0中每一个不同长度的拼音串Sj,分别利用杰卡德相似系数计算其与词汇库中对应级别所有词汇的相似度Pjk,将相似度Pjk与基准评分Ci相乘,得到拼音串Sj与所有对应级别词汇的实际匹配得分Tjk,公式化Tjk的计算过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011576504.X/2.html,转载请声明来源钻瓜专利网。