[发明专利]基于模式匹配的哭声识别方法及智能看护系统有效
申请号: | 201710628135.6 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107591162B | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 张晖;毛小旺;高财政 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/51;G08B21/00 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 刘莎 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于模式匹配的哭声识别方法及智能看护系统,该方法首先建立婴儿哭声数据库;其次,实时采集当前环境中的语音信息,经过预处理成语音特征向量序列,与哭声数据库进行特征匹配,并将匹配的结果进行哭声判决。若识别结果为哭声语音,则立即触发报警指令。智能看护系统一方面会向用户发送婴儿哭闹报警信号;另一方面,通过播放预先录制的具有安抚婴儿情绪功能的语音,对婴儿进行情绪安抚。本发明提出的哭声识别方法及智能看护系统能及时发现婴儿哭闹,解决部分家长的看护难题。此外,还为智能家居实现智能看护功能提供了解决方案。 | ||
搜索关键词: | 基于 模式 匹配 哭声 识别 方法 智能 看护 系统 | ||
【主权项】:
基于模式匹配的哭声识别方法,其特征在于,包括以下具体步骤:步骤1,采集婴儿哭声语音信号,建立哭声数据库,具体为:S101,采集若干婴儿哭声语音信号,并将其分别转换成数字语音信号;S102,在设定的时间窗内,对S101中的数字语音信号进行分帧加窗处理,得到多帧语音信号;对每帧语音信号分别提取12维的梅尔频率倒谱系数MFCC作为其特征向量,从而得到多帧语音信号对应的特征向量序列;S103,采用K‑means算法对S102中得到的若干特征向量序列进行聚类,并对聚类后每类中的特征向量序列求取平均值后,存入哭声数据库;步骤2,实时采集当前环境中的语音信号并转换成数字语音信号,根据S102中的方法对提取实时数字语音信号的特征向量序列;步骤3,将步骤2中提取的实时数字语音信号的特征向量序列与步骤1中聚类后每类特征向量序列的均值进行逐帧匹配,将每帧匹配到的相似度最大的类别作为该帧的识别结果;步骤4,根据步骤3中得到的每帧的识别结果,判断实时语音信号是否为哭声,完成识别;具体为:S401,统计实时数字语音信号的特征向量序列中识别结果为第i类的帧数Si,其中,1≤i≤n,n为聚类的类别总数;S402,选取S401中得到的Si的最大值对应的类别作为实时数字语音信号的特征向量序列的识别结果;S403,判断是否超过实时数字语音信号的特征向量序列长度的一半,若是,则判定实时语音信号为哭声,否则判定为非哭声。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710628135.6/,转载请声明来源钻瓜专利网。