[发明专利]目标声音确定方法、装置、计算机设备和介质有效
申请号: | 202211122041.9 | 申请日: | 2022-09-15 |
公开(公告)号: | CN115240689B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 戴志涛;吴蕊珠 | 申请(专利权)人: | 深圳市水世界信息有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L15/26;G06F40/194 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市龙华区龙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 声音 确定 方法 装置 计算机 设备 介质 | ||
1.一种目标声音确定方法,其特征在于,包括:
接收耳机佩戴者的第一声音信号和周围人声的第二声音信号;
判断是否存在对话场景;
若存在对话场景,则利用语音识别将所述第一声音信号内容转换成第一文本,将所述第二声音信号内容转化成第二文本;
计算所述第一文本和所述第二文本之间的相似度;
若所述相似度超过阈值,则将所述第二文本所属人声作为目标声音信号;
根据预设参数,调整所述目标声音信号的响度值和频率值。
2.根据权利要求1所述的目标声音确定方法,其特征在于,所述判断是否存在对话场景的步骤,包括:
计算接收到所述第一声音信号和所述第二声音信号之间的时间间隔;
判断所述时间间隔是否超过预设时长;
若未超过预设时长,则判定为存在对话场景。
3.根据权利要求1所述的目标声音确定方法,其特征在于,所述判断是否存在对话场景的步骤,还包括:
提取所述第一声音信号对应的第一关键字,以及所述第二声音信号对应的第二关键字;其中,所述第一关键字与所述第二关键字至少包含一个字或词;
将所述第一关键字依次与所述第二关键字进行匹配,并记录匹配个数;
若所述匹配个数超过多个,则判定为存在对话场景。
4.根据权利要求1所述的目标声音确定方法,其特征在于,所述若存在对话场景,则利用语音识别将所述第一声音信号内容转换成第一文本,将所述第二声音信号内容转化成第二文本的步骤,包括:
判断所述第二声音信号是否存在多个人的人声信号;
若存在多个人的人声信号,则提取出所述第二声音信号内的多个声纹特征;
判断所述多个声纹特征中是否存在属于预设声纹库的待测目标声纹;
若存在所述待测目标声纹,则将所述待测目标声纹所属的声音信号内容转换成所述第二文本;
若不存在所述待测目标声纹,则计算所述第二声音信号中的多个人声与所述第一声音信号之间的距离;
选择所述第二声音信号中的距离耳机佩戴者最近的人声作为待测声音信号;
将所述待测声音信号内容转化成所述第二文本。
5.根据权利要求1所述的目标声音确定方法,其特征在于,所述根据预设参数,调整所述目标声音信号的步骤,包括:
提取所述第一文本和所述第二文本的关键字;
将所述关键字与预设的主题模型库中的主题模型进行匹配,获得目标主题模型;
根据所述目标主题模型,对所述目标声音信号内容进行修正;
根据预设参数,调整修正后的所述目标声音信号的响度值和频率值。
6.根据权利要求1所述的目标声音确定方法,其特征在于,所述若所述相似度超过阈值,则将所述第二文本所属人声作为目标声音信号的步骤之后,包括:
判断所述目标声音信号是否存在多个人的人声信号;
若存在,则将所述目标声音信号中的不同人的人声信号进行分离;
根据指令,对所述分离后的人声信号进行切换。
7.根据权利要求1所述的目标声音确定方法,其特征在于,所述计算所述第一文本和所述第二文本之间的相似度的步骤,包括:
对所述第一文本进行分词获得第一分词库,对所述第二文本进行分词获得第二分词库;
对所述第一分词库进行计算获取第一词向量,对所述第二分词库进行计算获取第二词向量;
根据所述第一词向量获取第一句向量,根据所述第二词向量获取第二句向量;
根据所述第一句向量和所述第二句向量,计算所述第一文本和所述第二文本的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市水世界信息有限公司,未经深圳市水世界信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211122041.9/1.html,转载请声明来源钻瓜专利网。