[发明专利]一种基于姓氏的语音识别系统及方法在审
申请号: | 201711440127.5 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108091325A | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 徐东群;庄永军 | 申请(专利权)人: | 深圳市三宝创新智能有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L15/18;G10L15/26 |
代理公司: | 深圳力拓知识产权代理有限公司 44313 | 代理人: | 龚健 |
地址: | 518055 广东省深圳市福田区华*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 姓氏 语音处理单元 语音识别系统 主控制单元 获取单元 模型单元 训练单元 语音 有效地实现 处理方式 系统计算 语音识别 识别率 准确率 混淆 汉字 | ||
本发明公开了一种基于姓氏的语音识别系统及方法,包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元,本发明不仅简单便捷,有效地实现高准确率快速姓氏汉字的识别,同时针对姓氏多种易混淆的可能设计一系列的处理方式,提高了语音识别的性能以及识别率,减轻了系统计算负担。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种基于姓氏的语音识别系统及方法。
背景技术
语言是人类相互交流最常用、最有效、最重要和最方便的通信形式,语音是语言的声学表现,与机器进行语音交流是人类一直以来的梦想。随着计算机技术的飞速发展,语音识别技术也取得突破性的成就,人与机器用自然语言进行对话的梦想逐步接近实现。语音识别技术的应用范围极为广泛,不仅涉及到日常生活的方方面面,在军事领域也发挥着极其重要的作用。它是信息社会朝着智能化和自动化发展的关键技术,使人们对信息的处理和获取更加便捷,从而提高人们的工作效率。
发明内容
本发明的目的在于提供一种基于姓氏的语音识别系统及方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于姓氏的语音识别系统,包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元。
作为本发明的进一步技术方案:所述语音获取单元为M6027麦克风。
作为本发明的进一步技术方案:所述语音处理单元分为声学模型特征提取模块、语言模型特征提取模块、混淆处理模块和单双姓氏处理模块。
一种基于姓氏的语音识别方法,包含以下步骤:
A、用户输入一串语音;
B、系统获取语音信号,通过声学模型对语音进行特征提取,在声学模型得出发音序列后,利用语言模型从候选文字序列中找出概率最大的字符串序列;
C、从汉字字符串序列中提取出表示姓氏的汉字,通过收集的全部汉字及其拼音字典,可将汉字转换为拼音,若其为多音字,只转换为其中某一个拼音;
D、如果该姓氏为单字姓氏,则将其拼音加入列表list,针对姓氏拼音做易混淆发音的处理,以及查找多音字的处理,并将结果全部保存到list中;
E、如果该姓氏为双字姓氏,则将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音,每个字都可得一个列表,将两个列表进行两两任意组合,找出这些拼音组合对应所有姓氏;
F、根据得到的拼音列表,可查找到每个拼音对应的姓氏汉字,列出说话人所表达的全部可能姓氏汉字;
G、最终获取对应姓氏汉字列表。
与现有技术相比,本发明的有益效果是:本发明不仅简单便捷,有效地实现高准确率快速姓氏汉字的识别,同时针对姓氏多种易混淆的可能设计一系列的处理方式,提高了语音识别的性能以及识别率,减轻了系统计算负担。
附图说明
图1是一种基于姓氏的语音识别系统的结构框图
图2是一种基于姓氏的语音识别方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市三宝创新智能有限公司,未经深圳市三宝创新智能有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711440127.5/2.html,转载请声明来源钻瓜专利网。