[发明专利]一种可自定义指令识别的语音拍照系统在审
申请号: | 201610204445.0 | 申请日: | 2016-04-01 |
公开(公告)号: | CN105931637A | 公开(公告)日: | 2016-09-07 |
发明(设计)人: | 王丹丹;臧娴 | 申请(专利权)人: | 金陵科技学院 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/02;G10L15/06;G10L25/24;H04N5/232 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 戴朝荣 |
地址: | 211169 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种可自定义指令识别的语音拍照系统,所述系统包括语音指令采集模块、音频信号预处理模块、音频信号特征提取模块、语音定义训练模块和语言识别控制模块,所述语音指令采集模块采集语音指令的音频信号;采集到的音频信号依次经过音频信号预处理模块和音频信号特征提取模块进行预处理和特征提取;语音定义训练模块建立语音特征模式库,将经过预处理和特征提取的音频信号所对应的语音指令均录入所述特征模式库;语言识别控制模块通过搜索最小匹配误差得到识别结果,执行相应的语音指令。本发明所公开的技术方案一方面可以提升语音拍照功能的实用性,另一方面也实现了用户个性化的定制,增强了用户与设备之间的交互性。 | ||
搜索关键词: | 一种 自定义 指令 识别 语音 拍照 系统 | ||
【主权项】:
一种可自定义指令识别的语音拍照系统,其特征在于:所述系统包括语音指令采集模块、音频信号预处理模块、音频信号特征提取模块、语音定义训练模块和语言识别控制模块,所述语音指令采集模块采集语音指令的音频信号;采集到的音频信号依次经过音频信号预处理模块和音频信号特征提取模块进行预处理和特征提取;语音定义训练模块建立语音特征模式库,将经过预处理和特征提取的音频信号所对应的语音指令均录入所述特征模式库;语言识别控制模块将经过预处理和特征提取的音频信号所对应的语音指令与特征模式库中存储的语音指令进行失真度测量,通过搜索最小匹配误差得到识别结果,执行相应的语音指令。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金陵科技学院,未经金陵科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610204445.0/,转载请声明来源钻瓜专利网。
- 上一篇:语音识别方法、设备及系统
- 下一篇:多语系语音辨识装置及其方法