[发明专利]双子空间特征迁移学习方法有效
申请号: | 201910398094.5 | 申请日: | 2019-05-14 |
公开(公告)号: | CN110163272B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 肖仲喆;黄敏;陶智 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 常州市权航专利代理有限公司 32280 | 代理人: | 陈萍 |
地址: | 215006*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 双子 空间 特征 迁移 学习方法 | ||
本发明公开了一种基于大数据分析的双子空间特征迁移学习方法及装置,其中方法包括:根据源集公共子空间Cs、目标域特性表达Fst和源集数据类别标签Ys,获取源集迁移表达Ts;根据目标集公共子空间Ct和目标集特性子空间Ft,获取目标集迁移表达Tt;在源集迁移表达Ts上进行模型训练,获取训练模型;根据训练模型对目标集迁移表达Tt进行智能识别。通过本实施例,将部分数据集的特征参数迁移到其他数据集上去,能够将采集于不同来源的数据进行综合利用,相当于把若干数据规模偏小的数据集整合为符合大数据需求的海量数据集,从而能够更好地将人工智能算法,尤其是深度学习方法,应用到这些数据集规模偏小的方向上。
技术领域
本发明涉及大数据人工智能算法技术领域,具体涉及一种双子空间特征迁移学习方法。
背景技术
在当前的大数据背景下,各种人工智能算法越来越多的体现出数据驱动的特点,很大程度上依赖于足够大的数据支持。
针对一部分重要的人工智能应用方向,例如语音情感识别,特殊音频事件检测等,这类应用需要使用大数据条件下产生的人工智能算法来提升其性能,但该类应用中定向数据采集、数据标注方面存在困难;可用的单一数据集虽然具有一定规模,但与海量数据量要求相比仍有一定的差距。在前述条件下,使用如循环神经网络(Recurrent NeuralNetworks,RNN)的人工智能运算结果识别准确率不高,无法充分发挥其优势。
发明内容
有鉴于此,本发明实施例提供了一种双子空间特征迁移学习方法,以解决现有技术中在数据采集,数据标注不方便,和/或,数据集数量不足以支撑运算时的情况下,如语音情感识别和特殊音频事件检测这类的大数据分析算法无法充分发挥优势的问题。
本发明实施例提供了一种双子空间特征迁移学习方法,包括:
根据源集公共子空间Cs、目标域特性表达Fst和源集数据类别标签Ys,获取源集迁移表达Ts;
根据目标集公共子空间Ct和目标集特性子空间Ft,获取目标集迁移表达Tt;
在源集迁移表达Ts上进行模型训练,获取训练模型;
根据训练模型对目标集迁移表达Tt进行智能识别。
可选的,根据训练模型对目标集迁移表达Tt进行智能识别,智能识别的算法包括:卷积神经网络,循环神经网络,长短记忆网络和图嵌入算法中的一种或多种。
可选的,在获取源集迁移表达Ts之前,还包括:
获取共性子空间降维矩阵P、源集特征参数矩阵Xs、映射矩阵R、源集特性子空间矩阵Ds、目标集特征参数矩阵Xt和目标集特性子空间矩阵Dt。
可选的,获取源集迁移表达Ts,包括:
将源集公共子空间Cs和目标域特性表达Fst合并得到第一合并集;
源集数据类别标签Ys作为训练用的真值对第一合并集进行描述,即,
可选的,获取目标集迁移表达Tt,包括:
将目标集公共子空间Ct和目标集特性子空间Ft合并得到第二合并集,即,
可选的,源集公共子空间Cs由共性子空间降维矩阵P的转置矩阵和源集特征参数矩阵Xs组成,即,Cs=PTXs;
目标域特性表达Fst由映射矩阵R、源集特征参数矩阵Xs和源集特性子空间矩阵Ds组成,即,Fst=RFs=R(DsXs);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910398094.5/2.html,转载请声明来源钻瓜专利网。