[发明专利]语音增强方法及装置有效
申请号: | 201810185895.9 | 申请日: | 2018-03-07 |
公开(公告)号: | CN110248197B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 陈扬坤;钱能锋;陈展 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | H04N21/218 | 分类号: | H04N21/218;H04N21/233;H04N21/234;G06T3/40 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 江崇玉 |
地址: | 310051 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 方法 装置 | ||
1.一种语音增强方法,其特征在于,视频采集区域包括M个不同的拍摄区域,所述M为大于1的正整数,所述方法包括:
获取所述M个拍摄区域各自对应的拍摄图像;
将所述M个拍摄图像进行拼接,得到目标图像,所述目标图像为全景图像,且包括N个图像区域,所述N为大于1的正整数,所述N个图像区域为根据拍摄区域的数量对所述目标图像划分得到;
当接收到语音信号时,对所述语音信号进行解析获取语音内容,当所述语音内容中存在与所述N个图像区域中目标图像区域对应的预设信息相匹配的关键字词时,确定所述语音信号对应的目标图像区域;
根据第一预设对应关系,将所述目标图像区域对应的空间方向确定为目标空间方向,所述目标空间方向用于指示需要进行语音增强处理的空间方向,所述第一预设对应关系包括所述图像区域与所述空间方向之间的对应关系;
根据第二预设对应关系,确定与所述目标空间方向对应的目标局部空间,所述第二预设对应关系包括所述空间方向和局部空间之间的对应关系;
对来自于所述目标局部空间的声音信号进行语音增强处理,并对来自于非目标局部空间的声音信号进行语音抑制处理;
其中,所述非目标局部空间为所述视频采集区域中除所述目标局部空间以外的其它空间。
2.一种语音增强装置,其特征在于,视频采集区域包括M个不同的拍摄区域,所述M为大于1的正整数,所述装置包括:
获取模块,用于获取所述M个拍摄区域各自对应的拍摄图像;将所述M个拍摄图像进行拼接,得到目标图像,所述目标图像为全景图像,且包括N个图像区域,所述N为大于1的正整数,所述N个图像区域为根据拍摄区域的数量对所述目标图像划分得到;
确定模块,用于当接收到语音信号时,对所述语音信号进行解析获取语音内容,当所述语音内容中存在与所述N个图像区域中目标图像区域对应的预设信息相匹配的关键字词时,确定所述语音信号对应的目标图像区域;根据第一预设对应关系,将所述目标图像区域对应的空间方向确定为目标空间方向,所述目标空间方向用于指示需要进行语音增强处理的空间方向,所述第一预设对应关系包括所述图像区域与空间方向之间的对应关系;
增强模块,用于根据第二预设对应关系,确定与所述目标空间方向对应的目标局部空间,所述第二预设对应关系包括所述空间方向和局部空间之间的对应关系;对来自于所述目标局部空间的声音信号进行语音增强处理,并对来自于非目标局部空间的声音信号进行语音抑制处理;
其中,所述非目标局部空间为所述视频采集区域中除所述目标局部空间以外的其它空间。
3.一种摄像机,其特征在于,所述摄像机包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1所述的语音增强方法。
4.一种终端,其特征在于,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1所述的语音增强方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810185895.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于调色板编解码的方法和设备
- 下一篇:媒体信息汇聚方法、装置和系统