[发明专利]显示设备及音频处理方法在审
申请号: | 202210102847.5 | 申请日: | 2022-01-27 |
公开(公告)号: | CN114615534A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 王海盈;邢文峰 | 申请(专利权)人: | 海信视像科技股份有限公司 |
主分类号: | H04N21/43 | 分类号: | H04N21/43;H04N21/439;G10L21/0272;G10L25/30;G06V20/40;G06V40/20;G06V10/82;G06N3/02 |
代理公司: | 北京国之大铭知识产权代理事务所(普通合伙) 11565 | 代理人: | 张平 |
地址: | 266555 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 显示 设备 音频 处理 方法 | ||
本申请涉及一种显示设备及音频处理方法,应用于音频处理技术领域,显示设备包括:控制器,被配置为:对第一声道音频数据和第二声道音频数据分别进行人声分离,得到第一声道第一人声音频数据、第一声道第一背景音频数据、第二声道第一人声音频数据和第二声道第一背景音频数据;将第一声道第一人声音频数据和第二声道第一人声音频数据合并,得到目标人声音频数据;获取图像数据,若检测到唇动坐标,根据唇动坐标和每个音频输出接口的坐标,确定每个音频输出接口对应的人声权重;将目标人声音频数据和人声权重的乘积,及第一声道第一背景音频数据和/或第二声道第一背景音频数据合并,并进行音效增强处理得到并输出音频数据,以提高音频的立体效果。
技术领域
本申请涉及音频处理技术领域,尤其涉及一种显示设备及音频处理方法。
背景技术
随着芯片AI(人工智能)运算能力的提升,机器学习被广泛应用于图像、声音领域,也出现了很多场景上的结合。相关技术中,通过机器学习可以实现音画同步。然而,该方法声音的方位感较差。
发明内容
为了解决上述技术问题,本申请提供了一种显示设备、音频处理方法、存储介质及程序产品。
根据本申请的第一方面,提供了一种显示设备,包括:控制器和多个音频输出接口;
所述控制器,被配置为:对获取到的第一声道音频数据和第二声道音频数据分别进行人声分离,得到第一声道第一人声音频数据和第一声道第一背景音频数据,以及第二声道第一人声音频数据和第二声道第一背景音频数据;
将所述第一声道第一人声音频数据和所述第二声道第一人声音频数据进行合并,得到目标人声音频数据;
获取所述第一声道音频数据和第二声道音频数据所在时刻的图像数据,对所述图像数据进行唇动检测,如果检测到所述显示设备屏幕中的唇动坐标,根据所述唇动坐标和所述多个音频输出接口的坐标,确定所述多个音频输出接口分别对应的人声权重;
针对每个音频输出接口,根据所述音频输出接口的坐标,确定所述音频输出接口对应第一声道第一背景音频数据和/或第二声道第一背景音频数据;
将所述目标人声音频数据和所述音频输出接口对应的人声权重的乘积,以及所述音频输出接口对应的第一声道第一背景音频数据和/或第二声道第一背景音频数据合并,并进行音效增强处理,得到所述音频输出接口对应的音频数据;
针对每个音频输出接口,被配置为:输出所述音频输出接口对应的音频数据。
在一些实施例中,所述控制器还被配置为:按照第一增益分别对所述第一声道第一人声音频数据和所述第二声道第一人声音频数据进行增益处理,得到第一声道第二人声音频数据和第二声道第二人声音频数据;
按照第二增益分别对所述第一声道第一背景音频数据和所述第二声道第一背景音频数据进行增益处理,得到第一声道第二背景音频数据和第二声道第二背景音频数据;其中,所述第一增益和所述第二增益根据所述显示设备对应的声音控制模式确定;
所述控制器,被配置为:
将所述第一声道第二人声音频数据和所述第二声道第二人声音频数据进行合并,得到目标人声音频数据;以及
针对每个音频输出接口,根据所述音频输出接口的坐标,确定所述音频输出接口对应第一声道第二背景音频数据和/或第二声道第二背景音频数据;
将所述目标人声音频数据和所述音频输出接口对应的人声权重的乘积,以及所述音频输出接口对应的第一声道第二背景音频数据和/或第二声道第二背景音频数据合并,并进行音效增强处理,得到所述音频输出接口对应的音频数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信视像科技股份有限公司,未经海信视像科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210102847.5/2.html,转载请声明来源钻瓜专利网。