[发明专利]一种语音识别方法及语音控制系统在审
申请号: | 201911343629.5 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111081218A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 邵勇;孙嘉俊;朴明哲;严康建 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/18;G10L15/187;G10L15/22 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 控制系统 | ||
本发明公开一种语音识别方法包括以下步骤:步骤1、获取语音字符串;步骤2、将所述语音字符串转化为一文本信息;步骤3、采用预设的文本信息处理逻辑对所述文本信息进行基础语义分析和专业词汇语义分析,提取出文本信息中的关键信息;步骤4、将所述关键信息进行消除歧义处理,得到识别结果。本发明还提供一种语音控制系统。
技术领域
本发明属于语音识别技术领域,尤其涉及一种语音识别方法及语音控制系统。
背景技术
随着语音识别技术的发展,语义分析正在日益改变人类的生产和生活方式,被广泛应用于诸如语音输入系统、语音控制系统和智能语音助手系统等领域,如开车时的语音输入文字、智能音箱、智能家居等,语音识别与物联网技术的快速发展正在改变着我们的生活方式,为我们的生活提供了便利。
语音识别技术的具体过程包括:
(1)采集和预处理步骤:未知语音经过话筒变换成电信号后加在识别系统的输入端,经过预处理过程对电信号进行降噪和滤波等处理,以初步提高信噪比;
(2)识别步骤:对经过预处理的电信号进行识别处理,根据用户的语音特定建立语音模型,根据语音模型对电信号进行分析,抽取电信号中包括的语音特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中需要根据语音识别的模型,将计算机中预存储的语音模板和输入的语音特征进行匹配,按照预定的匹配策略找出最优的匹配模板;
(3)后处理步骤:根据模板的映射表和定义获知语音特征对应的文本信息。
其中,识别步骤作为语音识别的重要步骤通常有以下几个指标作为衡量标准:
(1)词汇表范围:语音设备能够识别的单词或词组的范围;
(2)说话人限制:语音设备能够识别指定语音、语调和音色的语音信息;
(3)训练要求:语音设备是否经过大量语音信号的识别训练过程;
(4)识别率:语音设备能够平均正确识别的百分数,取决于前三个参数。
针对上述语音识别参数而言存在以下问题:
(1)将语音信息分解为词素单位,语义识别过程较慢且针对特殊行业、专业词汇识别率不高;
(2)语音信息量大,受用户发出语音指令的方式影响,会对识别过程产生影响甚至误判;
(3)单个词、字的语义受上下文影响,会对识别率产生较大影响;
(4)语音录入后再处理语音信息,降低了整体识别的效率;
(5)环境噪声和干扰对语音识别过程产生严重影响。
因此,如何设计语音识别方案提高识别过程的准确率和识别效率成为亟待解决的技术问题。
发明内容
基于上述问题,本发明提供一种语音识别方法及语音控制系统。
为实现上述目的,本发明采用如下的技术方案:
一种语音识别方法,包括以下步骤:
步骤1、获取语音字符串;
步骤2、将所述语音字符串转化为一文本信息;
步骤3、采用预设的文本信息处理逻辑对所述文本信息进行基础语义分析和专业词汇语义分析,提取出文本信息中的关键信息;
步骤4、将所述关键信息进行消除歧义处理,得到识别结果。
作为优选,所述基础语义分析进行初次处理为:顺序分析语音字符串,根据预设的基础词汇库分析逻辑顺序,按照预设优先级,逐层提取词汇,建立语义信息树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911343629.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电力施工用出线管理装置
- 下一篇:一种加热器温度控制安装机构