[发明专利]一种基于VAD算法打断智能语音机器人对话的方法在审
申请号: | 201811626883.1 | 申请日: | 2018-12-28 |
公开(公告)号: | CN109509471A | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 刘鹏;孙传报 | 申请(专利权)人: | 浙江百应科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L25/78;H04L29/06 |
代理公司: | 杭州华知专利事务所(普通合伙) 33235 | 代理人: | 张德宝 |
地址: | 311121 浙江省杭州市余杭区仓前街*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能语音 机器人 用户意图 打断 语音输出 发言 算法 自然语言理解模块 即时通信模块 实时语音识别 音频数据发送 语音活动检测 背景声音 等待用户 模块识别 算法检测 网页界面 选择切换 语音播放 语音交流 预设 对话 过滤 网页 噪音 中断 | ||
1.一种基于VAD算法打断智能语音机器人对话的方法,其特征是,所述方法包括:
S1、用户在网页界面通过网页即时通信模块发起语音交流,智能语音机器人按照预设话术进行语音播放;
S2、智能语音机器人内的语音活动检测模块通过VAD算法实时检测判断用户是否发出声音,并过滤背景声音与噪音;
S3、若语音活动检测模块识别用户发出声音,中断智能语音机器人的语音输出,等待用户发言结束;
S4、智能语音机器人实时将用户发言音频数据发送至实时语音识别模块识别用户发言内容,并通过自然语言理解模块识别用户意图;
S5、语音活动检测模块识别用户发言结束,智能语音机器人根据识别用户意图改变,选择切换新话术节点;识别用户意图未改变,继续当前话术节点。
2.根据权利要求1所述的一种基于VAD算法打断智能语音机器人对话的方法,其特征是,所述智能语音机器人还包括第一SIP客户端,所述网页界面还包括第二SIP客户端,所述第一SIP客户端通过会话发起协议、实时传输协议向第二SIP客户端播放话术内容,所述网页即时通信模块通过会话发起协议、实时传输协议向智能语音机器人传输用户的实时音频数据。
3.根据权利要求1所述的一种基于VAD算法打断智能语音机器人对话的方法,其特征是,所述通过VAD自然算法判断用户是否发出声音的步骤如下:
(1)所述语音活动检测模块基于用户发言的音频数据计算最近1秒内复数个采样节点的声音频率;
(2)设置阈值,当采样节点的声音频率达到阈值时,则将采样节点计为一次有效音频;
(3)连续n个的采样节点均为有效音频时,计为一次有声片段;
(4)一段时间内的有声片段超过m个时,则判断当前用户处于发言状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江百应科技有限公司,未经浙江百应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811626883.1/1.html,转载请声明来源钻瓜专利网。