[发明专利]一种智能语音识别处理方法及系统有效
申请号: | 202111178759.5 | 申请日: | 2021-10-11 |
公开(公告)号: | CN113628623B | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 周柳阳;蒋林林 | 申请(专利权)人: | 深圳市一号互联科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/20;G01S11/14 |
代理公司: | 北京专赢专利代理有限公司 11797 | 代理人: | 陈进 |
地址: | 518000 广东省深圳市南山区粤海街道高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 语音 识别 处理 方法 系统 | ||
本发明公开了涉及信息监测相关领域,一种智能语音识别处理方法及系统,使得能够通过多组录音信息和传感信息对周边的生物进行定位,并获得声音发出生物的位置信息,从而根据该位置信息对录音信息进行聚焦处理,使其能够更为清晰和突出,提高语音识别转化的成功率和准确率,大大的提高了语音识别的成功率,解决了现有技术在嘈杂环境中无法有效识别的问题。
技术领域
本发明涉及信息监测相关领域,具体是一种智能语音识别处理方法及系统。
背景技术
随着技术的不断发展与快速进步,人工智能等技术逐渐成熟,人工智能的发展也带来了众多全新的区别于传统技术的控制方式,例如还在进一步研发中的脑波控制、眼动控制等,以及已经较为成熟的语音控制,这些全新的技术都为我们的生活生产方式带来了全新的改变。
现有技术中的语音识别多采用录音并对音轨进行分析,从而识别出其中的语音内容,然后将语音转化为文字信息,从而提取其中的控制关键词并进行响应,从而实现控制。
但现有技术中的这种处理方式,存在识别效率低下的问题,当录音环境中较为嘈杂且存在较多人同时发出声音时,对于语音的识别转化效率较低,因此容易发生嘈杂环境中无法进行语音控制的情况。
发明内容
本发明的目的在于提供一种智能语音识别处理方法及系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种智能语音识别处理方法,包含:
采集并生成多组录音信息,所述录音信息包括声音强度信息,多组所述录音信息由多个间隔设置的录音设备生成;
采集并生成多组传感信息,所述传感信息包括生物热源信息,多组所述传感信息与多个间隔设置的所述录音设备一一对应;
根据所述声音强度信息以及所述生物热源信息对声音发出点进行确定,并根据所述声音发出点对所述录音信息进行聚焦处理,并生成多组对象语音内容,所述聚焦处理用于加强所述录音中某一对象的声音强度;
对多组所述对象语音内容进行识别转化处理,并根据预设的执行语音指令集对所述对象语音内容进行响应,生成并输出响应内容。
作为本发明的进一步方案:所述录音设备的数量大于等于三组,多组所述录音设备间隔设置,且多组所述录音设备形成大于等于一个有限平面。
作为本发明的再进一步方案:所述根据所述声音强度信息以及所述生物热源信息对声音发出点进行确定的步骤包括:
读取每组所述传感信息中的多个生物热源信息;
通过将数组所述传感信息中的多个生物热源信息进行交叠,以获取生物位置信息;
读取所述录音信息中的所述声音强度信息,根据多组所述声音强度信息交叠生成声源范围信息,所述声音强度信息可用于生成声音方位信息;
将所述声源范围信息与所述生物位置信息做交集,生成多个声音发出点。
作为本发明的再进一步方案:所述根据所述声音发出点对所述录音信息进行聚焦处理,并生成多组对象语音内容的步骤包括:
获取数个所述声音发出点的位置信息;
依次根据所述声音发出点的位置信息对多组所述录音信息进行聚焦处理,生成多组对象语音内容。
作为本发明的再进一步方案:所述聚焦处理包括对声音发出点的声音信息进行重叠增强,以及对所述声音发出点以外的声音信息进行抵消减弱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市一号互联科技有限公司,未经深圳市一号互联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111178759.5/2.html,转载请声明来源钻瓜专利网。