[发明专利]一种用于语音情感计算的无监督主动学习方法有效
申请号: | 201910999055.0 | 申请日: | 2019-10-21 |
公开(公告)号: | CN110782876B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 伍冬睿;刘子昂 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/08;G10L25/27;G10L25/63 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智;曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 语音 情感 计算 监督 主动 学习方法 | ||
1.一种用于语音情感计算的无监督主动学习方法,其特征在于,该方法包括以下步骤:
S1.获取提取特征后语音样本的特征维度d,设定交给专家打标的语音样本个数M、迭代次数c的最大值cmax,若M≤d+1,设定步数索引i的最大值S=1,否则,设定步数索引i的最大值S=2,S确定之后,设定第i步需要获取的待打标样本数目Mi和第i步使用的优化方法,要求初始化步数索引i为1;
S2.初始化迭代次数c为1,从语音样本集中聚类选取Mi个样本初始化待打标样本集Sic,将Sic存入待打标样本集库SLi中,其中,Sic表示第i步的第c轮迭代对应的待打标样本集,所述聚类选取如下:对语音样本集中的全部样本使用k-mean聚类,k=Mi,选取每个类中距离类中心最近的样本;
S3.从待打标样本集Sic中选择一个第c轮迭代中未被优化的待打标样本,固定其余(Mi-1)个样本和之前所有步选出的样本,通过第i步使用的优化方法,从排除固定样本后的语音样本集中选择一个最有价值的样本替换待优化的待打标样本,更新Sic;
S4.如果第c轮迭代中,待打标样本集Sic中的所有样本都被优化了一次,则进入步骤S5,否则,返回步骤S3;
S5.如果第c轮迭代的待打标样本集Sic已经存在于待打标样本集库SLi中,或者已经达到最大迭代次数cmax,则进入步骤S6;否则,将当前迭代的待打标样本集Sic存入待打标样本集库SLi中,下一轮迭代的待打标样本集Si(c+1)初始化为Sic,c=c+1,返回步骤S3;
S6.如果i=S,则输出这i步选出的共计M个待打标样本给专家,结束;否则,i=i+1,返回步骤S2,其中,
第一步使用的优化方法是线性流形法,p=1,…,M1,包括以下步骤:
(1)固定待打标样本集S1c中除待优化的待打标样本xp外的其他(M1-1)个样本,这些固定的样本确定一个(M1-2)维的超平面H;
(2)计算待优化的待打标样本xp所在的聚类Cp中所有样本点到超平面H的距离然后计算聚类Cp中每个样本与聚类Cp中所有样本的平均距离其中,表示聚类Cp中的样本个数;
(3)计算聚类Cp中每个样本的重要性度量
(4)选择V值最大的样本,作为当前的最优样本替换待优化的待打标样本xp,从而更新S1c;
第二步使用的优化方法是贪婪搜索法,q=1,…,M2,包括以下步骤:
(1)固定待打标样本集S2c中除待优化的待打标样本xq外的其他(M2-1)个样本,加上第一步选出的样本集S1c,形成含有(M-1)个固定样本的集合St;
(2)计算待优化的待打标样本xq所在的聚类中所有样本点到固定样本的集合St的贪婪距离计算聚类中每个样本与聚类中所有样本的平均距离其中,表示聚类中的样本个数;
(3)计算聚类中每个样本的重要性度量
(4)选择V值最大的样本,作为当前的最优样本替换待优化的待打标样本xq,从而更新S2c。
2.如权利要求1所述的方法,其特征在于,根据打标成本预算与回归模型的期望精度,设定交给专家打标的语音样本个数M;根据期望的运算代价,设定最大迭代次数cmax。
3.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1或2所述的用于语音情感计算的无监督主动学习方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910999055.0/1.html,转载请声明来源钻瓜专利网。