[发明专利]目标声音确定方法、装置、计算机设备和介质有效
申请号: | 202211122041.9 | 申请日: | 2022-09-15 |
公开(公告)号: | CN115240689B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 戴志涛;吴蕊珠 | 申请(专利权)人: | 深圳市水世界信息有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L15/26;G06F40/194 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市龙华区龙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 声音 确定 方法 装置 计算机 设备 介质 | ||
本发明提供了一种目标声音确定方法、装置、计算机设备和介质,包括:接收耳机佩戴者的第一声音信号和周围人声的第二声音信号;判断是否存在对话场景;若存在对话场景,则利用语音识别将第一声音信号内容转换成第一文本,将第二声音信号内容转化成第二文本;计算第一文本和第二文本之间的相似度;若相似度超过阈值,则将第二文本所属人声作为目标声音信号;根据预设参数,调整目标声音信号。对比第一文本和第二文本的相似度,若两者的相似度超过了阈值,说明第一文本和第二文本的关联性强,因此判断第二文本所属的第二声音信号就是与耳机佩戴者对话的目标声音信号,根据这一结果,放大目标声音信号,使耳机佩戴者听清目标对话人的声音内容。
技术领域
本发明涉及到听觉可穿戴设备的领域,具体而言,涉及到一种目标声音确定方法、装置、计算机设备和存储介质。
背景技术
辅音耳机是一种基于新一代蓝牙音频技术标准LE Audio对无线耳机进行改进的听觉可穿戴设备。辅音耳机不需要经过FDA的医疗器械审批程序,属于大众消费品范畴,可以帮助轻度至中度听力损失患者改善听力。相比于助听器高昂的费用或验配的不便,辅音耳机外观时尚、价格适中、可自助调节。但是辅音耳机在进行使用的时候,是将拾取到的所有声音全部都放大,包括交谈的人的声音、本人的声音,还包含了环境中嘈杂的噪音,而这些噪声大概率是不希望被放大的,所以亟需一种方法来进行目标声音的确定,定向放大目标声音。
发明内容
本发明的主要目的为提供一种目标声音确定方法、装置、计算机设备和存储介质,旨在解决辅音耳机在放大声音的同时也会放大噪音,影响耳机佩戴者听取对话人的交谈内容的问题。
本发明公开了以下技术方案:
一种目标声音确定方法,包括:
接收耳机佩戴者的第一声音信号和周围人声的第二声音信号;
判断是否存在对话场景;
若存在对话场景,则利用语音识别将所述第一声音信号内容转换成第一文本,将所述第二声音信号内容转化成第二文本;
计算所述第一文本和所述第二文本之间的相似度;
若所述相似度超过阈值,则将所述第二文本所属人声作为目标声音信号;
根据预设参数,调整所述目标声音信号。
进一步地,所述判断是否存在对话场景的步骤,还包括:
计算接收到所述第一声音信号和所述第二声音信号之间的时间间隔;
判断所述时间间隔是否超过预设时长;
若未超过预设时长,则判定为存在对话场景。
进一步地,所述判断是否存在对话场景的步骤,包括:
提取所述第一声音信号对应的第一关键字,以及所述第二声音信号对应的第二关键字;其中,所述第一关键字与所述第二关键字至少包含一个字或词;
将所述第一关键字依次与所述第二关键字进行匹配,并记录匹配个数;
若所述匹配个数超过多个,则判定为存在对话场景。
进一步地,所述若存在对话场景,则利用语音识别将所述第一声音信号内容转换成第一文本,将所述第二声音信号内容转化成第二文本的步骤,包括:
判断所述第二声音信号是否存在多个人的人声信号;
若存在多个人的人声信号,则提取出所述第二声音信号内的多个声纹特征;
判断所述多个声纹特征中是否存在属于预设声纹库的待测目标声纹;
若存在所述待测目标声纹,则将所述待测目标声纹所属的声音信号内容转换成所述第二文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市水世界信息有限公司,未经深圳市水世界信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211122041.9/2.html,转载请声明来源钻瓜专利网。