[发明专利]可加载个性化特征模型的语音识别系统及方法在审
申请号: | 201610150095.4 | 申请日: | 2016-03-16 |
公开(公告)号: | CN107204189A | 公开(公告)日: | 2017-09-26 |
发明(设计)人: | 郎立国 | 申请(专利权)人: | 中航华东光电(上海)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/07 |
代理公司: | 上海宣宜专利代理事务所(普通合伙)31288 | 代理人: | 刘君 |
地址: | 200233 上海市闵行*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 加载 个性化 特征 模型 语音 识别 系统 方法 | ||
1.一种可加载个性化特征模型的语音识别系统,其特征在于,所述可加载个性化特征模型的语音识别系统包括:
语音编解码芯片,用于将接收到的模拟语音信号进行A/D转换得到数字音频信号,及将数字信号处理器后的数字音频信号进行D/A转换为模拟语音信号;
数字信号处理器,用于对输入的数字音频信号进行语音识别算法处理,识别完成后将识别的结果语音合成为输出数字音频信号,发送给语音编解码芯片进行语音输出;
FLASH芯片,用于存储数字信号处理器的语音识别程序及通用语音模型数据,上电启动后,程序及通用语音模型数据从FLASH芯片加载到DDR RAM芯片中;
DDR RAM芯片,用于运行语音识别程序,存储通用语音模型数据及个性化特征模型数据;
串口芯片,数字信号处理器通过串口芯片和外部通信,通过串口给出识别出的词汇对应的汉字码;
网络芯片,当某人口音特别严重时,利用通用语音模型识别时识别率小于95%,用于加载个性化特征模型数据,以提高其识别率。
2.根据权利要求1所述的可加载个性化特征模型的语音识别系统,其特征在于,所述可加载个性化特征模型的语音识别系统还包括锂电池,锂电池用于给所述可加载个性化特征模型的语音识别系统供电。
3.根据权利要求1所述的可加载个性化特征模型的语音识别系统,其特征在于,所述数字信号处理器选用高性能低功耗的浮点型TMS320C6748数字信号处理器。
4.根据权利要求1所述的可加载个性化特征模型的语音识别系统,其特征在于,所述语音编解码芯片需要支持多种采样率。
5.根据权利要求1所述的可加载个性化特征模型的语音识别系统,其特征在于,所述网络芯片选择LAN8710A型芯片。
6.根据权利要求1所述的可加载个性化特征模型的语音识别系统,其特征在于,所述数字信号处理器的通信和语音编解码芯片的通信都采取DMA方 式通信。
7.一种可加载个性化特征模型的语音识别方法,其特征在于,其包括如下步骤:
步骤一,系统上电后,首先将语音识别程序从FLASH芯片加载到DDR RAM芯片中,然后将通用语音模型数据加载到DDR RAM芯片中,开始运行准备语音识别;
步骤二,语音识别模块上电程序运行后,系统进行识别按键检测,检测到识别按键按下后,开始控制音频编解码芯片,进行AD转换接收语音信号,然后通过语音识别算法进行语音识别,同时系统检测到识别按键抬起后,通过串口给出识别出的词汇对应的汉字码,同时将识别的词汇进行语音合成,控制音频编解码芯片将合成的结果DA转换为模拟语音信号进行输出;
步骤三,语音识别模块运行中,如果检测到模型切换按键按下,加载下一条个性化语音模型数据到DDR RAM芯片,如果没有下一条个性化语音模型数据,加载通用语音模型数据到DDR RAM芯片中,后续语音识别将会使用新加载的模型进行语音识别;
步骤四,语音识别模块运行中,如果接收到网络加载的个性化语音模型数据,则将收到的个性化语音模型数据存储到FLASH芯片中及DDR RAM芯片中,后续语音识别将会使用新加载的模型进行语音识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中航华东光电(上海)有限公司,未经中航华东光电(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610150095.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种土壤检测用样品储存箱
- 下一篇:一种具有通风功能的蒲公英存储装置