[发明专利]一种设备播放音量的智能调节方法和系统在审
申请号: | 202110594282.2 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113380244A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 黄昌正;周言明;陈曦;黄庆麟 | 申请(专利权)人: | 幻境虚拟现实(广州)智能科技研究院有限公司;广州幻境科技有限公司;东莞市易联交互信息科技有限责任公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L25/84;G10L25/18;G10L25/30;G10L25/51;G10L21/0208 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510635 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 设备 播放 音量 智能 调节 方法 系统 | ||
本发明实施例提供了一种设备播放音量的智能调节方法和系统。所述方法包括:截取所述设备正在播放的音频,并同时采集环境声音,将所述音频与所述环境声音进行相似度对比,判断所述相似度是否低于预设阈值,若是,则将所述环境声音中所述音频的声音过滤掉,得到外部环境声音,判断所述外部环境声音是否包含人声,若是,判断所述人声是否包含与预设指令匹配的语句,若是,则执行所述预设指令对应的操作,若否,则降低所述设备的播放音量,本发明实现了当播放设备所在的环境有人交谈时,无须用户主动调节,便能自动降低所述设备的播放音量。
技术领域
本发明涉及音量调节技术领域,特别是涉及一种设备播放音量的智能调节方法和系统。
背景技术
现有的播放设备的音量调节方法主要有三种,第一种调节方法为调节播放设备上的调节旋钮进行音量的调节,此方法需要用户走到播放设备前进行调节,第二种调节方法为使用遥控器进行调节,当遥控器遗失时,不能及时地进行音量调节,第三种调节方法为根据用户语音进行调节,由用户说出控制的指令,播放设备进行语音识别后执行相应的操作。上述三种音量的调节方法均需要用户主动操作实现音量的调节,并不方便。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种设备播放音量的智能调节方法和相应的一种设备播放音量的智能调节系统。
为了解决上述问题,本发明实施例公开了一种设备播放音量的智能调节方法,所述方法包括:
截取所述设备正在播放的音频,并同时采集环境声音;
将所述音频与所述环境声音进行相似度对比,判断所述相似度是否低于预设阈值;
若是,则将所述环境声音中所述音频的声音过滤掉,得到外部环境声音;
判断所述外部环境声音是否包含人声;
若是,判断所述人声是否包含与预设指令匹配的语句;
若是,则执行所述预设指令对应的操作;
若否,则降低所述设备的播放音量。
可选地,将所述音频与所述环境声音进行相似度对比,判断所述相似度是否低于预设阈值的步骤包括:
对所述音频进行傅里叶变换,得到第一实时频谱数据;
对所述环境声音进行傅里叶变换,得到第二实时频谱数据;
将所述第一实时频谱数据与所述第二实时频谱数据进行相似度对比;
判断所述相似度是否低于预设阈值。
可选地,将所述环境声音中所述音频的声音过滤掉,得到外部环境声音的步骤包括:
将所述音频进行180度反转相位处理,得到反相音频;
采用反相音频与所述环境声音进行叠加处理,得到外部环境声音。
可选地,判断所述外部环境声音是否包含人声的步骤包括:
建立人声识别初始神经网络模型;
获取多组人声样本以及多组非人声样本;
使用所述多组人声样本以及多组非人声样本训练所述人声识别初始神经网络模型,得到人声识别神经网络模型;
将所述外部环境声音输入到所述人声识别神经网络模型中,所述人声识别神经网络模型判断所述外部环境声音是否包含人声。
可选地,所述降低音频播放音量的步骤之后,还包括:
判断所述外部环境声音是否包含人声;
若否,则恢复所述音频的播放音量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于幻境虚拟现实(广州)智能科技研究院有限公司;广州幻境科技有限公司;东莞市易联交互信息科技有限责任公司,未经幻境虚拟现实(广州)智能科技研究院有限公司;广州幻境科技有限公司;东莞市易联交互信息科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110594282.2/2.html,转载请声明来源钻瓜专利网。