[发明专利]一种基于食品安全语料数据的语音匹配方法在审

申请号：	201610009314.7	申请日：	2016-01-07
公开（公告）号：	CN105741842A	公开（公告）日：	2016-07-06
发明（设计）人：	郑丽敏;黄斌;杨璐;王炳蔚	申请（专利权）人：	中国农业大学
主分类号：	G10L15/26	分类号：	G10L15/26;G10L25/51
代理公司：	北京卫平智业专利代理事务所(普通合伙) 11392	代理人：	董琪
地址：	100193 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于食品安全语料数据的语音匹配方法，实现了方便、快速且准确的从语音提取到语音匹配的过程。本发明的语音匹配方法，包括：包括音频信号的预处理、语音信号的特征提取、食品安全语料库的构建、基于改进的DTW语音识别别算法。本发明使用食品安全语料库完成音频数据的语音匹配过程，较文本匹配方式更为快捷、方便，且准确率较高，且能给出音频数据与食品事件的一个评价分，可以作为先进的技术运用于食品检测等领域。
搜索关键词：	一种基于食品安全语料数据语音匹配方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

音频数据在食品安全方面的语音匹配方法，其特征在于：音频信号的预处理、语音信号的特征提取、食品安全语料库的构建、基于DTW的语音识别算法。音频信号的预处理包含去噪、预加重、加窗分帧。去噪采用谱减法进行去噪，减少语音中噪声的干扰。预加重的目的是提高语音信号的高频部分，使信号的频谱变得平坦，便于后续的分析。预加重使用6dB/倍频程的提高高频特性的预加重数字滤波器实现。加窗分帧是通过加窗来截取一段语音信号进行分析。同时相邻两帧要设置交叠，称为帧移，本发明采用汉明窗进行加窗分帧，采用256个采样点的窗口长度，帧移位窗口长度的50％，即128个采样点。语音信号的特征提取采用梅尔频率倒谱系数作为音频识别特征，同时计算器一阶差分系数。特征距离的计算采用改进的动态时间规整算法，针对食品安全相关词汇，能极大的提高匹配成功率。食品安全语料库的构建，参照GB2760‑2014标准，构建食品分类信息语料库。进行音频数据匹配识别，得到本音频与食品事件相关程度的得分。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国农业大学，未经中国农业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610009314.7/，转载请声明来源钻瓜专利网。

上一篇：确定加权函数的设备和方法以及量化设备和方法
下一篇：基于相似环境录音频谱统计计算的录音设备识别方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于食品安全语料数据的语音匹配方法在审

专利文献下载