[发明专利]声音美容与情感修饰的方法在审
申请号: | 201811538693.4 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109599094A | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 段玉聪;李亚婷;宋正阳 | 申请(专利权)人: | 海南大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/08;G10L15/16;G10L21/003;G10L21/013;G10L21/0208 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 570228 海*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种声音美容与情感修饰的方法,主要通过用户的需求,对语音进行声音处理以及情感修饰,改变原来语音的音色、音调、以及原来所包含的情感,并且也可以去噪使得所听到的语音更清晰易懂。不仅可以满足用户对想听声音的需求,并且也可通过调整对方说话的情绪使得自己更为舒适放松。 | ||
搜索关键词: | 修饰 语音 美容 声音处理 去噪 音调 音色 说话 放松 清晰 情绪 | ||
【主权项】:
1.本发明公开了一种声音美容与情感修饰的方法,主要通过用户的需求,对语音进行声音处理以及情感修饰,改变原来语音的音色、音调、以及原来所包含的情感,并且也可以去噪使得所听到的语音更清晰易懂;不仅可以满足用户对想听声音的需求,并且也可通过调整对方说话的情绪使得自己更为舒适放松;(1)通过语音识别采集声音数据,对于有口音的声音数据要进行模糊识别(若包含国内外的方言,则需要在过程中查询方言语音数据库,来较为精确地确定该用户所说话的语义以及词义),将输入的声音转化为特征量方便进一步处理;(2)根据关联词之间的相对强度以及词语与词语之间的间隔标记出重点词汇,其次根据每个词语的语调、声音的强弱以及句子整体的说话方式奠定情感基调;可以根据关键词之间的相对强度识别出模糊语句的大概意思,词语与词语之间的间隔可以避免不同词连接在一起有不同的意思,有助于分辨哪些字应该组成一个词,并表达出这个词的含义;对于每句话、每个词甚至每个字,语调以及强弱不同,都能表达出不一样的情感,我们可以根据这个基础来确定用户所听到或者自己说的话是饱含一种怎样的情感,并且也可以根据这些因素来改变语音使得其具有用户所需要的情绪;具体做法根据在存储有读音与音素之间的转换规则或读音与音素串之间的转换规则的转换规则的存储部内存储的转换规则,将在存储有识别词的读音的识别此存储部内存储的识别词的读音转换成音素串;再提取出标准模式,最后进行连接;对识别词读音多的情况下也非常适用;(3)根据以上的数据积累,对声音进行处理,通过语调、声音强弱、间隔等改变原语音的情绪,并且可通过收集特殊人的声音信息对声音进行美容,使其听起来像某位明星的声音;详细一点说,采集一些特殊声音的数据,例如某位主持人声音的音调、音频、音色、语调等等,可以根据得到的这些数据来调整用户希望改变的那一段语音,对它的各种值进行修改,从而尽最大程度上满足用户需要;即详细解释为:对所拥有的声音数据存为数据库,将他们的一些特征都转化为参数存入,在用户要求转变时,即可通过改变这些参数来改变声音的收听效果;我们不仅仅需要建立声音转化模型,情感转化模型也是必须的;先获取训练数据(可根据动态时间规整算法对输入输出数据做时长对齐),再对其进行预处理,提取训练数据的情绪影响因素(包括字词的音调、说话间隔等),根据初始化声音转换模型的参数,训练模型建立,因为该模型可以是神经网络模型,由编码器组成,每个编码器代表某一类相似原发音人语音信息的本证空间,需要对其语音信号的频谱特征进行变换(其中表示输入编码层i的第n个本征空间模型的输出,表示输入层i的第n个本征空间模型对于的网络参数,δ表示激励函数);(4)对最后输出的结果消除影响效果的各种噪音噪音(白噪音或其他有色噪音),或增强声音的辨识度;通过信号处理消除噪音,可通过在声学上输出与向可移动体的空间里面泄露的噪音的相位具有相反相位的声音来消除噪音;使得声音美容和情绪化之后的语音更加清晰,让用户听觉上也更加舒适。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南大学,未经海南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811538693.4/,转载请声明来源钻瓜专利网。