[发明专利]一种基于对抗型人工智能网络的语音服务方法与系统有效
申请号: | 201910586563.6 | 申请日: | 2019-07-01 |
公开(公告)号: | CN110379441B | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 龚裕 | 申请(专利权)人: | 特斯联(北京)科技有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/30;G10L25/63;G06N3/08 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 李小朋;谷波 |
地址: | 100027 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对抗 人工智能 网络 语音 服务 方法 系统 | ||
本发明基于BP神经网络以及GAN网络,提供了一种能够使计算机语音根据用户情感变化产生相应的情感变化的方法,通过使BP神经网络在信息正向传播和误差反向传播两个过程的训练,准确的输出用户输入语音情绪状态的类型,并以该情绪状态类型为基准,通过GAN网络的生成对抗过程,输出相应的赋情绪语音,并通过上述方法设计出了一种基于对抗型人工智能网络的语音服务系统。
技术领域
本发明涉及人工智能领域,更具体的说是涉及一种基于对抗型人工智能网络的语音服务方法与系统。
背景技术
目前,人机对话越来越普遍,例如在各种智能设备与人类的语音交互功能或者是自动电话客户服务当中,智能设备可以通过计算机自动生成的语音与用户进行语音交互,在该过程中,计算机根据与用户对话的需要,产生语义内容,通过语义内容,从保存有事先录制的语音片段的语音库当中,找到语义内容对应的语音片段并组合播放,进而实现人机对话。
但是,计算机自动生成语音的技术手段并不能实现人们通过人机对话达到情感上交流的目的,计算机自动生成的语音始终表现为语速均匀、声调平缓、音量波动小,该语音无法根据对话者情绪的变化产生相应的情感变化,导致使用户在交流中无法体会到计算机语音真实自然的情感,交流过程感觉不够自然。
因此,如何实现与对话者具有情感共鸣的人工智能语音服务技术,是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于对抗型人工智能网络的语音服务方法与系统,从而使计算机语音能够根据对话者的情绪变化产生相应的情绪变化,以期实现使用者在人机对话过程中更加舒服自然的寄托及表达情感的目的。
为了实现上述目的,本发明采用如下技术方案:
一种基于对抗型人工智能网络的语音服务方法,包括如下步骤:
S1、输入用户语音,提取反映情绪状态的特征量;
S2、建立BP神经网络,并将所述S1获得的特征量输入BP神经网络,获取用户情绪状态的类型;
S3、根据所述S2获取的用户情绪状态类型,在训练样本库中找到对应的情绪语音样本;
S4、基于由语音生成器和辨别器组成的GAN网络,辨别器在以情绪语音样本为基准进行训练后,对语音生成器生成的赋情绪语音进行真伪判别,判别结果为伪时,继续训练语音生成器,语音生成器将在训练过程中调整参数,重新生成赋情绪语音,直至辨别器对语音生成器生成的赋情绪语音判别为真,输出与情绪语音样本的情绪状态相同的赋情绪语音。
优选的,所述S1中,包括S11-S13三个具体步骤;其中,
S11、输入用户语音,并对语音进行滤波、采样、量化、预加重处理,可以提高用户输入的语音信号的识别率,使频谱变得平稳,便于分析;
S12、利用加窗分帧的方法,将语音划分为若干个语音帧。因为后期语音处理需要平稳的语音信号,而一段语音信号整体看是不平稳的,但是局部信号是平稳的,所以将一段语音进行分帧处理,另外,由于每一帧的起始端和末尾端会出现不连续的地方,所以分帧越多与原始信号的误差也就越大,用加窗的方法可以使分帧后的信号变得连续;
S13、提取每一个语音帧的语音持续时间、短时能量极值和均值、基音频率、共振峰作为所述特征量;
优选的,所述S2分为S21-S24四个具体步骤,
S21、建立一个可以根据输入的语音特征量识别并输出语音的情绪状态类型的BP神经网络,BP神经网络由多层神经元构成,各层神经元之间具有特定的权值;BP神经网络具有自适应、自组织、自学习能力,有信息正向传播和误差反向传播两个过程,当信息正向传播时,实际输出若与预期输出不符,BP网络的误差反向传播过程可以修正各层权值,使误差达到最小,从而通过训练的BP神经网络能够准确输出情绪状态类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于特斯联(北京)科技有限公司,未经特斯联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910586563.6/2.html,转载请声明来源钻瓜专利网。