[发明专利]一种人工智能学习的模糊语音语义识别方法及系统有效
申请号: | 201910713034.8 | 申请日: | 2019-08-02 |
公开(公告)号: | CN110600012B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 孙斌;李东晓 | 申请(专利权)人: | 光控特斯联(上海)信息科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G06N3/08 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 李小朋;谷波 |
地址: | 200232 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种人工智能学习的模糊语音语义识别方法及系统。本发明针对用户口述语音指令中存在的模糊语音,利用GAN网络架构重建为清晰的标准语音,进而基于标准语音实现语义信息的转化识别。并且,在对所述GAN网络的训练过程中,利用语音特征匹配将输入的模糊语音对应到更大范围的样本选集,以该样本选集实现对GAN网络的训练。 | ||
搜索关键词: | 一种 人工智能 学习 模糊 语音 语义 识别 方法 系统 | ||
【主权项】:
1.一种人工智能学习的模糊语音语义识别方法,包括以下步骤:/n步骤1,采集用户输入的模糊语音信号,并且提取模糊语音信号的高维度特征量;/n步骤2,根据模糊语音信号的频谱包络特征量,确定与模糊语音信号特征匹配的样本选集;/n步骤3,构建用于将模糊语音重建为标准语音的GAN架构的重建模型,利用所述样本选集,训练所述重建模型;/n步骤4,构建将模糊语音基频转化为标准语音基频的转换器;/n步骤5,将用户输入的模糊语音信号的频谱包络特征量输入训练完毕的重建模型,获得重建模型的生成器输出的重建标准语音的频谱包络特征量,并且将模糊语音基频输入转换器,转化重建标准语音的基频;/n步骤6,根据重建标准语音的频谱包络特征量以及基频,合成重建标准语音;/n步骤7,利用重建标准语音进行语义信息的识别。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于光控特斯联(上海)信息科技有限公司,未经光控特斯联(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910713034.8/,转载请声明来源钻瓜专利网。