[发明专利]一种人工智能学习的模糊语音语义识别方法及系统有效

专利信息
申请号: 201910713034.8 申请日: 2019-08-02
公开(公告)号: CN110600012B 公开(公告)日: 2020-12-04
发明(设计)人: 孙斌;李东晓 申请(专利权)人: 光控特斯联(上海)信息科技有限公司
主分类号: G10L15/06 分类号: G10L15/06;G10L15/02;G06N3/08
代理公司: 北京辰权知识产权代理有限公司 11619 代理人: 李小朋;谷波
地址: 200232 上海*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 人工智能 学习 模糊 语音 语义 识别 方法 系统
【说明书】:

发明提供了一种人工智能学习的模糊语音语义识别方法及系统。本发明针对用户口述语音指令中存在的模糊语音,利用GAN网络架构重建为清晰的标准语音,进而基于标准语音实现语义信息的转化识别。并且,在对所述GAN网络的训练过程中,利用语音特征匹配将输入的模糊语音对应到更大范围的样本选集,以该样本选集实现对GAN网络的训练。

技术领域

本申请涉及人工智能控制领域,尤其涉及一种人工智能学习的模糊语音语义识别方法及系统。

背景技术

随着语音识别与语义转换技术的成熟,人们利用语音命令控制服务设施越来越常见,在智慧建筑、智慧社区、智慧家庭中的应用越来越多。

举例来说,人们可以口述语音命令来控制智慧建筑、智慧社区、智慧家庭的各种服务设施运行。例如,人们可以针对智慧建筑的电梯发出“请升到第15层”的语音命令,也可以在智慧社区的门禁系统旁边说出“请呼叫XXX房间”、“请开门,开门密码是XXXXXX”、“请锁门”等语音命令,亦或者面向智慧家庭的中控面板附近说出“请打开空调”、“请调亮吊灯灯光”等语音命令。服务设施采集语音命令信号,经过必要的增强处理之后,进行语音命令到语义信息的转换识别,再由自然语言字符形态的语义信息生成机器代码形态的控制指令,服务设施可以按照控制指令执行必要的工作。相比于对按钮、按键型控制面板进行手动操控来,语音命令方式能够给用户带来更方便的体验和更大的自由度,特别是在用户是没有双手或者失明的残疾人,或者用户双手都持有物品,或者是因环境阻碍、距离远等因素无法触碰到控制面板等情况下,能够增强智慧建筑、智慧社区、智慧家庭的便利化和无障碍化。

然而,目前语音命令到语义信息的转换识别——也就是从声音信号到自然语言字符的识别过程中,还存在较大的误转换概率。其中,对于清晰的语音尚能够实现较好的识别,但是对于模糊语音来说实现正确的语义信息转换尤其具有难度。而在声音信号传输到被服务设施采集的过程中,由于声音自身削弱,周围环境噪声的干扰,包括用户自身不清晰发音、口音等因素影响,都会造成模糊语音的产生,直接导致语音命令无法被正确识别为语义信息,导致无法控制服务设施运行。

现有技术中面向模糊语音的语义识别主要是采用对声音信号的增强等前处理,以及采用置信度评估的方式,无法有效解决通过模糊语音实现精确语义识别的问题。

随着人工智能的发展,现有技术中发展出将SVM向量机、神经网络等识别模型应用于对语音的语义识别技术,具体来说是利用语音样本提取特征量训练识别模型,然后对识别模型输入待识别语音的特征量,获得语义信息。但是,如果将以上识别模型直接用于模糊语音的语义识别,则由于模糊语音的变化形态极为丰富,导致模糊语音特征量呈现非常丰富的多样性,因而模糊语音样本往往代表性不足,导致人工智能识别模型训练不充分以及训练后的识别模型对于其它模糊语音适用性不强的问题

发明内容

针对现有技术中的上述问题,本发明提供了一种人工智能学习的模糊语音语义识别方法及系统。本发明针对用户口述语音指令中存在的模糊语音,利用GAN网络架构重建为清晰的标准语音,进而基于标准语音实现语义信息的转化识别。并且,在对所述GAN网络的训练过程中,利用语音特征匹配将输入的模糊语音对应到更大范围的样本选集,以该样本选集实现对GAN网络的训练。

本发明提供了一种人工智能学习的模糊语音语义识别方法,包括以下步骤:

步骤1,采集用户输入的模糊语音信号,并且提取模糊语音信号的高维度特征量;

步骤2,根据模糊语音信号的频谱包络特征量,确定与模糊语音信号特征匹配的样本选集;

步骤3,构建用于将模糊语音重建为标准语音的GAN架构的重建模型,利用所述样本选集,训练所述重建模型;

步骤4,构建将模糊语音基频转化为标准语音基频的转换器;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于光控特斯联(上海)信息科技有限公司,未经光控特斯联(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910713034.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top