[发明专利]有标签高维数据的最优投影集合方法及情感文本分类方法有效
申请号: | 202010208815.4 | 申请日: | 2020-03-23 |
公开(公告)号: | CN111382274B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 王雨思;夏佳志;奎晓燕 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 数据 最优 投影 集合 方法 情感 文本 分类 | ||
1.一种情感文本分类方法,其特征在于具体包括如下步骤:
(S1).获取需要投影的自然语言情感分类的高维数据的所有情感语义类别对;
(S2).针对步骤(S1)获取的所有情感语义类别对,计算类别对之间的类别对可分离向量空间;具体为采用如下步骤计算情感语义类别对可分离向量空间:
(A).根据需要投影的自然语言情感分类的高维数据的所有类别对,利用感知驱动的监督降维PDD方法,计算降维至一维的情感语义最优投影向量wi,从而得到所有类别对的情感语义最优投影向量集合W={w1,w2,...,wi,...,wm};
(B).采用基于超平面包围盒的类别对可分离向量空间的表达,对步骤(A)得到的情感语义最优投影向量集合进行表达,从而得到情感语义类别对可分离范围集合Bi={rij|j∈[1,n-1]};其中rij为第i个类别对元素的第j维的满足阈值条件的范围;所述情感语义类别对可分离范围集合构成情感语义类别对可分离向量空间;
(S3).根据步骤(S2)得到的情感语义类别对可分离向量空间,对情感语义可分离高维空间范围求交集,从而得到情感语义可分离向量空间的交空间;具体为采用如下步骤得到情感语义可分离向量空间的交空间:
(a).初始化邻接矩阵邻接矩阵G中,对角线元素为1,剩余元素均为0;
(b).遍历步骤S2获取的类别对可分离范围集合Bi={rij|j∈[1,n-1]}:
若则步骤(a)中的邻接矩阵G中的元素G[i][j]=1;否则G[i][j]=0;
(c).以步骤(b)获取的上三角邻接矩阵G作为情感语义可分离向量空间的交空间:
若G[i][j]=0,表示最优投影向量wi和wj所在的两个情感语义可分离空间有交空间;
否则,表示最优投影向量wi和wj所在的两个情感语义可分离空间无交空间;
(S4).根据步骤(S3)得到的情感语义可分离向量空间的交空间,选取情感语义可分离向量空间的交空间中的轴组成二维投影集合,从而得到最终的情感语义最优投影集合;具体为采用如下步骤获取二维投影集合:
1)将步骤(S3)得到的邻接矩阵G中的每个类别对作为一个点,类别对中的相交关系作为点与点之间的连线,构建得到图G={V,E};其中V表示图中的点,E表示图中的边;
2)采用近似算法得到步骤1)中的图的最大团集合,并根据顶点数目从多到少排序,得到完全图集合C={c1,c2,...,ci,...,ck},其中ci表示包含第i多个顶点数目的完全图;
3)初始化结果集合R={c1},并从c2开始依次遍历完全图集合C中每一个元素ci,依次获取最大且与集合R中不重复的元素,并将获取的元素加入集合R中,得到第一结果集合R;
4)若步骤3)中得到的集合R的元素个数为奇数,则对集合R中顶点数最多的团进行顶点细分,从而使得集合R的元素个数为偶数;
5)步骤4)中得到的集合R中,以集合R的奇数轴依次作为视图集合的x轴,偶数轴依次作为视图集合的y轴,构建情感语义最优投影集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010208815.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置