[发明专利]一种语音消息的智能处理方法在审
申请号: | 202010964983.6 | 申请日: | 2020-09-15 |
公开(公告)号: | CN112151032A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 赵敏敏;韩学垒 | 申请(专利权)人: | 济南雪景网络技术有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L25/51;G10L25/78;H04L12/58;G06F9/4401 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250000 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 消息 智能 处理 方法 | ||
本发明涉及一种语音消息的智能处理方法,包括:(1)、开启语音唤醒功能;(2)、从麦克风获取音频数据;(3)、检测音频数据是否有语音口令,没有则进入步骤(4),有则进入步骤(5);(4)、检测音频数据是否有声音,有则将其累加到数据池中;没有则检测上一段音频数据是否有声音,有则把该段音频数据累加到数据池中,没有则舍弃该段音频数据;之后返回步骤(2);(5)、裁掉数据池中包括语音口令的数据;(6)、判断有效语音数据是否大于一定时间,大于则进入步骤(7),小于则清空数据池中的音频数据并返回步骤(2);(7)、转换数据格式并进行发送.其不仅解放双手,减少了误操作的可能性,还减少了听语音消息的时间。
技术领域
本发明属于通信技术领域,涉及一种消息处理方法,具体涉及一种语音消息的智能处理方法。
背景技术
目前,用户通过社交软件发送语音消息时,录制过程中需要用手指一直接着录制按钮,并且会把停顿时的语音数据录制进去。
用现有的方式录制和发送语音消息时,由于需要一直用手指按着按钮,极易误操作,例如,还没有录制结束,由于不小心松手,把消息发送出去。取消发送的步骤也很繁琐,需要用手指在屏幕上滑动。同时,发送的语音消息中,包括一些停顿的空白数据,这就导致听消息的人多听到一些无效的消息,浪费听消息的人的时间。
鉴于现有技术的上述技术缺陷,迫切需要研发一种新型的语音消息处理方法。
发明内容
本发明的目的在于克服现有技术中存在的缺点,利用人工智能技术,主要是语音识别及唤醒技术,提供一种新型的语音消息处理方法,其不仅解放双手,减少了误操作的可能性,还减少了听语音消息的时间。
为了实现上述目的,本发明提供如下技术方案:
一种语音消息的智能处理方法,其特征在于,包括以下步骤:
(1)、开启语音唤醒功能;
(2)、从麦克风获取音频数据;
(3)、检测从麦克风获取的音频数据是否有语音口令,如果没有语音口令,则进入步骤(4),如果有语音口令,则唤醒成功,结束检测,进入步骤(5);
(4)、检测从麦克风获取的音频数据是否有声音,如果有声音则记录该段音频数据并将该段音频数据累加到数据池中;如果没有声音则检测上一段音频数据是否有声音,如果上一段音频数据有声音则把该段音频数据也累加到数据池中,如果上一段音频数据没有声音则舍弃该段音频数据;将该段音频数据累加到数据池中或舍弃该段音频数据后返回步骤(2)继续从麦克风获取音频数据;
(5)、裁掉数据池中包括语音口令的数据;
(6)、判断裁掉语音口令的数据之后的有效语音数据是否大于一定时间,如果大于等于一定时间,则进入步骤(7),如果小于一定时间,则清空数据池中的音频数据并返回步骤(2)继续从麦克风获取音频数据;
(7)、转换数据池中的音频数据的数据格式,并进行发送。
优选地,其中,所述步骤(1)中,利用百度语音唤醒软件工具开启语音唤醒功能。
优选地,其中,所述步骤(2)中,每次从麦克风中获取的是20毫秒的音频数据。
优选地,其中,所述步骤(4)中,利用WebRTC里的VAD算法检测从麦克风获取的音频数据是否有声音。
优选地,其中,所述步骤(6)中的一定时间为400毫秒。
优选地,其中,所述步骤(7)中,将数据池中的音频数据转成AMR格式。
优选地,其中,所述步骤(7)中,通过环信即时通讯软件开发工具进行自动发送。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南雪景网络技术有限公司,未经济南雪景网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010964983.6/2.html,转载请声明来源钻瓜专利网。