[发明专利]AI智能语音流采集在审
申请号: | 201911209849.9 | 申请日: | 2019-12-02 |
公开(公告)号: | CN112908316A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 谢伟平;柯玉蒙 | 申请(专利权)人: | 浙江思考者科技有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/22;G10L15/30;G10L15/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 311115 浙江省杭州市余杭区仓前街*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ai 智能 语音 采集 | ||
本发明公开了AI智能语音流采集,启动程序,在注意此刻采集到的语音流是否发送,在对麦克风说一句话,再看语音流是否发送,将采集到的语音流转化为数组,然后判断这句话的音量大小是否高于预设值,如果高于预设值则将语音流传递到云服务器,进行后续的语音识别机逻辑处理。本发明通过实时监听麦克风的语音流,用户在麦克风讲话,系统通过取样频率进行语音流采集,将采集到的语音流转化为数组,然后判断这句话的音量大小是否高于预设值,如果高于将语音流传递到云服务器,进行后续的语音识别机逻辑处理,本技术可实现实时采集语音流,在通过对语音流处理,更加人性化实现发送语音流。
技术领域
本发明涉及语音流采集技术领域,特别涉及AI智能语音流采集。
背景技术
人机对话过程中,用户难免会出现表达失误的情况,导致机器对用户语言理解出现偏差,在这时纠错机制对机器而言则非常重要,如缺少这个机制,用户需要花费相当长的时间将其意图解释清楚,相应的用户体验也会十分糟糕,另一方面,虽然可以很好的识别语音,但是却不能理解你的对话目的,语义理解上有偏差。
现有技术在特别是在语音流实时采集发送时,无触发条件,会耗费大量的网络资源,而本技术可实现实时采集语音流,在通过对语音流处理,更加人性化实现发送语音流。
发明内容
本发明的目的在于提供AI智能语音流采集,以解决背景技术提出的问题。
为实现上述目的,本发明提供如下技术方案:
AI智能语音流采集,包括以下具体使用方法:
步骤一:部署配置:
首先在win7系统环境下下载最新的python版本,然后安装下载包python-3.6.4-amd64.exe(安装版)搭配JDK1.8、Eclipse4.6版本,然后为装置添加安装目录搭到环境变量,只需要把python的安装目录添加到pth系统变量中即可;
步骤二:部署测试:
测试python安装是否成功,cmd打开命令行输入 python 命令,输入 print ('HelloWorld'),经过以上测试,python环境安装完毕;
步骤三:与云服务器连接:
AI语音云服务器所需要的技术模块有四个部分,分别为自动语音识别、自然语言理解、自然语言生成和文字转语音;
步骤四:程序开启测试:
启动程序,在注意此刻采集到的语音流是否发送,在对麦克风说一句话,再看语音流是否发送;
步骤五:程序正式开启:
测试完成后,采集到的语音流可以成功发送,对麦克风说话,语音流可以进行发送,则正式开启程序将有效语音流发送云服务器进行自动语音识别、自然语言理解、自然语言生成和文字转语音;
步骤六:语音流的采集:
程序启动后实时监听麦克风的语音流,用户在麦克风讲话,系统通过取样频率进行语音流采集;
步骤七:人声分析及上传云服务器:
将采集到的语音流转化为数组,然后判断这句话的音量大小是否高于预设值,如果高于预设值则将语音流传递到云服务器,进行后续的语音识别机逻辑处理。
优选的,步骤三中四个模块组交互流程的核心为意图。
优选的,意图主要表示为用户在使用AI语音流采集后所说的语音,这些意图代表了AI智能的核心功能,如果AI智能成功地识别了用户的意图,则需要AI语音流采集到用户语音后,将结果反馈给用户,如果AI智能无法识别用户意图,则需要给用户进行提示,指导用户使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江思考者科技有限公司,未经浙江思考者科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911209849.9/2.html,转载请声明来源钻瓜专利网。