[发明专利]一种语音消息的智能处理方法在审

申请号：	202010964983.6	申请日：	2020-09-15
公开（公告）号：	CN112151032A	公开（公告）日：	2020-12-29
发明（设计）人：	赵敏敏;韩学垒	申请（专利权）人：	济南雪景网络技术有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L25/51;G10L25/78;H04L12/58;G06F9/4401
代理公司：	暂无信息	代理人：	暂无信息
地址：	250000 山东省济南市***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音消息智能处理方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种语音消息的智能处理方法，包括：(1)、开启语音唤醒功能；(2)、从麦克风获取音频数据；(3)、检测音频数据是否有语音口令，没有则进入步骤(4)，有则进入步骤(5)；(4)、检测音频数据是否有声音，有则将其累加到数据池中；没有则检测上一段音频数据是否有声音，有则把该段音频数据累加到数据池中，没有则舍弃该段音频数据；之后返回步骤(2)；(5)、裁掉数据池中包括语音口令的数据；(6)、判断有效语音数据是否大于一定时间，大于则进入步骤(7)，小于则清空数据池中的音频数据并返回步骤(2)；(7)、转换数据格式并进行发送.其不仅解放双手，减少了误操作的可能性，还减少了听语音消息的时间。

技术领域

本发明属于通信技术领域，涉及一种消息处理方法，具体涉及一种语音消息的智能处理方法。

背景技术

目前，用户通过社交软件发送语音消息时，录制过程中需要用手指一直接着录制按钮，并且会把停顿时的语音数据录制进去。

用现有的方式录制和发送语音消息时，由于需要一直用手指按着按钮，极易误操作，例如，还没有录制结束，由于不小心松手，把消息发送出去。取消发送的步骤也很繁琐，需要用手指在屏幕上滑动。同时，发送的语音消息中，包括一些停顿的空白数据，这就导致听消息的人多听到一些无效的消息，浪费听消息的人的时间。

鉴于现有技术的上述技术缺陷，迫切需要研发一种新型的语音消息处理方法。

发明内容

本发明的目的在于克服现有技术中存在的缺点，利用人工智能技术，主要是语音识别及唤醒技术，提供一种新型的语音消息处理方法，其不仅解放双手，减少了误操作的可能性，还减少了听语音消息的时间。

为了实现上述目的，本发明提供如下技术方案：

一种语音消息的智能处理方法，其特征在于，包括以下步骤：

(1)、开启语音唤醒功能；

(2)、从麦克风获取音频数据；

(3)、检测从麦克风获取的音频数据是否有语音口令，如果没有语音口令，则进入步骤(4)，如果有语音口令，则唤醒成功，结束检测，进入步骤(5)；

(4)、检测从麦克风获取的音频数据是否有声音，如果有声音则记录该段音频数据并将该段音频数据累加到数据池中；如果没有声音则检测上一段音频数据是否有声音，如果上一段音频数据有声音则把该段音频数据也累加到数据池中，如果上一段音频数据没有声音则舍弃该段音频数据；将该段音频数据累加到数据池中或舍弃该段音频数据后返回步骤(2)继续从麦克风获取音频数据；

(5)、裁掉数据池中包括语音口令的数据；

(6)、判断裁掉语音口令的数据之后的有效语音数据是否大于一定时间，如果大于等于一定时间，则进入步骤(7)，如果小于一定时间，则清空数据池中的音频数据并返回步骤(2)继续从麦克风获取音频数据；

(7)、转换数据池中的音频数据的数据格式，并进行发送。

优选地，其中，所述步骤(1)中，利用百度语音唤醒软件工具开启语音唤醒功能。

优选地，其中，所述步骤(2)中，每次从麦克风中获取的是20毫秒的音频数据。

优选地，其中，所述步骤(4)中，利用WebRTC里的VAD算法检测从麦克风获取的音频数据是否有声音。

优选地，其中，所述步骤(6)中的一定时间为400毫秒。

优选地，其中，所述步骤(7)中，将数据池中的音频数据转成AMR格式。

优选地，其中，所述步骤(7)中，通过环信即时通讯软件开发工具进行自动发送。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于济南雪景网络技术有限公司，未经济南雪景网络技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】