[发明专利]AI智能语音流采集在审

申请号：	201911209849.9	申请日：	2019-12-02
公开（公告）号：	CN112908316A	公开（公告）日：	2021-06-04
发明（设计）人：	谢伟平;柯玉蒙	申请（专利权）人：	浙江思考者科技有限公司
主分类号：	G10L15/18	分类号：	G10L15/18;G10L15/22;G10L15/30;G10L15/34
代理公司：	暂无信息	代理人：	暂无信息
地址：	311115 浙江省杭州市余杭区仓前街***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	ai 智能语音采集
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了AI智能语音流采集，启动程序，在注意此刻采集到的语音流是否发送，在对麦克风说一句话，再看语音流是否发送，将采集到的语音流转化为数组，然后判断这句话的音量大小是否高于预设值，如果高于预设值则将语音流传递到云服务器，进行后续的语音识别机逻辑处理。本发明通过实时监听麦克风的语音流，用户在麦克风讲话，系统通过取样频率进行语音流采集，将采集到的语音流转化为数组，然后判断这句话的音量大小是否高于预设值，如果高于将语音流传递到云服务器，进行后续的语音识别机逻辑处理，本技术可实现实时采集语音流，在通过对语音流处理，更加人性化实现发送语音流。

技术领域

本发明涉及语音流采集技术领域，特别涉及AI智能语音流采集。

背景技术

人机对话过程中，用户难免会出现表达失误的情况，导致机器对用户语言理解出现偏差，在这时纠错机制对机器而言则非常重要，如缺少这个机制，用户需要花费相当长的时间将其意图解释清楚，相应的用户体验也会十分糟糕，另一方面，虽然可以很好的识别语音，但是却不能理解你的对话目的，语义理解上有偏差。

现有技术在特别是在语音流实时采集发送时，无触发条件，会耗费大量的网络资源，而本技术可实现实时采集语音流，在通过对语音流处理，更加人性化实现发送语音流。

发明内容

本发明的目的在于提供AI智能语音流采集，以解决背景技术提出的问题。

为实现上述目的，本发明提供如下技术方案：

AI智能语音流采集，包括以下具体使用方法：

步骤一：部署配置：

首先在win7系统环境下下载最新的python版本，然后安装下载包python-3.6.4-amd64.exe（安装版）搭配JDK1.8、Eclipse4.6版本，然后为装置添加安装目录搭到环境变量，只需要把python的安装目录添加到pth系统变量中即可；

步骤二：部署测试：

测试python安装是否成功，cmd打开命令行输入 python 命令，输入 print ('HelloWorld')，经过以上测试，python环境安装完毕；

步骤三：与云服务器连接：

AI语音云服务器所需要的技术模块有四个部分，分别为自动语音识别、自然语言理解、自然语言生成和文字转语音；

步骤四：程序开启测试：

启动程序，在注意此刻采集到的语音流是否发送，在对麦克风说一句话，再看语音流是否发送；

步骤五：程序正式开启：

测试完成后，采集到的语音流可以成功发送，对麦克风说话，语音流可以进行发送，则正式开启程序将有效语音流发送云服务器进行自动语音识别、自然语言理解、自然语言生成和文字转语音；

步骤六：语音流的采集：

程序启动后实时监听麦克风的语音流，用户在麦克风讲话，系统通过取样频率进行语音流采集；

步骤七：人声分析及上传云服务器：

将采集到的语音流转化为数组，然后判断这句话的音量大小是否高于预设值，如果高于预设值则将语音流传递到云服务器，进行后续的语音识别机逻辑处理。

优选的，步骤三中四个模块组交互流程的核心为意图。

优选的，意图主要表示为用户在使用AI语音流采集后所说的语音，这些意图代表了AI智能的核心功能，如果AI智能成功地识别了用户的意图，则需要AI语音流采集到用户语音后，将结果反馈给用户，如果AI智能无法识别用户意图，则需要给用户进行提示，指导用户使用。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江思考者科技有限公司，未经浙江思考者科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911209849.9/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]AI智能语音流采集在审

专利文献下载