[发明专利]一种婴儿啼哭声识别提示方法及系统有效
申请号: | 201710787722.X | 申请日: | 2017-09-04 |
公开(公告)号: | CN107767874B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 周燕莉 | 申请(专利权)人: | 南方医科大学南方医院 |
主分类号: | G10L17/06 | 分类号: | G10L17/06;G10L25/24;G10L25/66;G06K9/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑泽萍;胡辉 |
地址: | 510515 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 婴儿 啼哭 识别 提示 方法 系统 | ||
本发明公开了一种婴儿啼哭声识别提示方法及系统,包括步骤:实时获取婴儿的啼哭声信号和动作图像;对婴儿啼哭声信号进行预处理后,计算获得婴儿啼哭声信号的反向梅尔频率倒谱系数,并对反向梅尔频率倒谱系数进行离散化处理,得到反向梅尔频率倒谱系数的离散值;根据预设的基于贝叶斯分类算法建立的婴儿哭声识别模型,对反向梅尔频率倒谱系数的离散值进行分类处理,从而识别出该婴儿啼哭声信号所对应的哭声状态;采用实时获取的婴儿动作图像校验从婴儿啼哭声信号识别获得的哭声状态;发出对应的提示信号。本发明计算方法简单,计算效率高,识别精度高,可以提高哭声状态识别的准确度和精度,可广泛应用于婴儿护理领域中。
技术领域
本发明涉及婴儿声音分析技术领域,特别是涉及一种婴儿啼哭声识别提示方法及系统。
背景技术
啼哭是婴儿表达的唯一方式,是一种特殊的“语言”。婴儿的哭声有几种基本表达,包括饥饿、困倦、需要拍嗝、肠痉挛和不舒适,现代科学研究表明,全世界的宝宝在3月龄前,婴儿的哭声根据婴儿的当前状态而存在固有的典型模式,可成人一般不能准确理解婴儿啼哭的原因,不能了解婴儿啼哭所反应的需求,这样难免造成对婴儿护理、照料的不周,不利于婴儿的健康成长。对于现在的新生儿科、产科或月子中心等医疗服务机构来说,婴儿住院期间,对婴儿啼哭声进行监视是通过采集到婴儿啼哭声后,人工去查看婴儿的情况,或者同时还采集婴儿的图像,结合图像来判断婴儿的需求。这种方式也依赖于护士等工作人员的经验,不能准确、科学地获取婴儿啼哭声所反应的需求状态。
发明内容
为了解决上述的技术问题,本发明的目的是提供一种婴儿啼哭声识别提示方法及系统。
本发明解决其技术问题所采用的技术方案是:
一种婴儿啼哭声识别提示方法,包括以下步骤:
实时获取婴儿的啼哭声信号和动作图像;
对婴儿啼哭声信号进行预处理后,计算获得婴儿啼哭声信号的反向梅尔频率倒谱系数,并对反向梅尔频率倒谱系数进行离散化处理,得到反向梅尔频率倒谱系数的离散值;
根据预设的基于贝叶斯分类算法建立的婴儿哭声识别模型,对反向梅尔频率倒谱系数的离散值进行分类处理,从而识别出该婴儿啼哭声信号所对应的哭声状态;
基于预设的动作行为数据库,采用实时获取的婴儿动作图像校验从婴儿啼哭声信号识别获得的哭声状态;
基于校验后的哭声状态,发出对应的提示信号。
进一步,所述哭声状态包括以下状态中的任一种:饥饿、困倦、需要拍嗝、肠痉挛和不舒适。
进一步,还包括建立哭声识别模型这一步骤,其包括步骤:
获取多个婴儿啼哭声样本信号,并标注每个婴儿啼哭声样本信号所对应的哭声状态;
对每个婴儿啼哭声样本信号进行预处理后,计算获得婴儿啼哭声样本信号的反向梅尔频率倒谱系数,并对反向梅尔频率倒谱系数进行离散化处理,得到反向梅尔频率倒谱系数的离散值;
建立样本数据库,记录下每个婴儿啼哭声样本信号所对应的哭声状态、反向梅尔频率倒谱系数的离散值;
利用贝叶斯分类算法对样本数据库进行处理后,建立贝叶斯分类模型,并将贝叶斯分类模型作为婴儿哭声识别模型。
进一步,所述利用贝叶斯分类算法对样本数据库进行处理后,建立贝叶斯分类模型,并将贝叶斯分类模型作为婴儿哭声识别模型这一步骤,具体包括步骤:
统计样本数据库中每个哭声状态所对应的婴儿啼哭声样本信号的数量,进而计算样本数据库中每个哭声状态的统计概率;
统计每个哭声状态下的每个反向梅尔频率倒谱系数的离散值所对应的婴儿啼哭声样本信号的数量,进而计算每个哭声状态下的每个反向梅尔频率倒谱系数的离散值的条件概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方医科大学南方医院,未经南方医科大学南方医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710787722.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:地漏(大鼻象)
- 下一篇:用于移动计算装置的由音频信标激活的数字内容提取