[发明专利]一种跨领域文本情感倾向性分析方法有效
申请号: | 200910242427.1 | 申请日: | 2009-12-11 |
公开(公告)号: | CN101714135A | 公开(公告)日: | 2010-05-26 |
发明(设计)人: | 吴琼;谭松波;段洣毅;程学旗 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 领域 文本 情感 倾向性 分析 方法 | ||
1.一种跨领域文本情感倾向性分析方法,包括下列步骤:
1)确定源领域和目标领域中文本与词的初始情感分;
2)根据测试文本集和测试词集分别与所有词集和所有文本集的关系 建立测试文本集DU与测试词集WU和训练词集WL间的相似矩阵M、测试 词集WU与测试文本集DU和训练文本集DL间的相似矩阵N和测试词集 WU与所有词集之间的相似矩阵V中的一个或多个,计算一个或多个相似 矩阵的归一化矩阵和邻域矩阵;其中,DU={d1,…,di,…,dnd},其中di表示 第i个测试文本的向量,DL={dnd+1,…,dj,…,dnd+md},其中dj表示第j个训 练文本的向量,WU={w1,…,wnw}是DU中文本内的词的集合,WL= {wnw+1,…,wnw+mw}是DL中文本内的词的集合,相似矩阵M中前nw列表示 DU和WU间相似矩阵,后mw列表示DU和WL间相似矩阵;相似矩阵N中 前nd列表示WU和DU间相似矩阵,后md列表示WU和DL间相似矩阵; 相似矩阵V中前nw列表示WU和WU间的相似矩阵,后mw列表示WU和 WL间的相似矩阵;
3)利用所述源领域和目标领域中文本与词的初始情感分和所述一个 或多个相似矩阵的邻域矩阵迭代计算测试文本和测试词的情感分并进行 归一化。
2.根据权利要求1所述的方法,其特征在于,所述步骤2)还包括根 据测试文本集和所有文本集的关系建立测试文本集DU和所有文本集之间 的相似矩阵U,并计算所述相似矩阵U的归一化矩阵和邻域矩阵;相似矩 阵U中前nd列表示DU间的相似矩阵,后md列表示DU和DL间的相似矩 阵;
所述步骤3)中所述迭代计算测试文本和测试词的情感分还利用所述 相似矩阵U的邻域矩阵。
3.根据权利要求1或2所述的方法,其特征在于,所述步骤2)中建 立所述相似矩阵M和/或N,并计算其归一化矩阵和邻域矩阵的步骤进一 步包括:
以测试文本、测试词、训练文本和训练词为结点,测试词和训练词在 测试文本和训练文本中的重要性为边的权重建立文本-词情感图,根据所 述文本-词情感图建立相似矩阵M和/或N;
将所述相似矩阵M和/或N归一化;
将归一化矩阵的每一行中属于不同领域的两部分分别进行降序排列 得到矩阵和/或;
由所述矩阵的元素在所述相似矩阵M中的列号构成邻域矩阵Mn 中的元素Mnij,由所述矩阵的元素在所述相似矩阵N中的列号构成邻 域矩阵Nn中的元素Nnij。
4.根据权利要求1或2所述的方法,其特征在于,所述步骤2)中建 立所述相似矩阵V,并计算其归一化矩阵和邻域矩阵的步骤进一步包括:
以测试词和训练词为结点,词间语义相似性为边的权重建立词-词情 感图,根据所述词-词情感图建立相似矩阵V;
将归一化矩阵的每一行中属于不同领域的两部分分别进行降序排列 得到矩阵;
由所述矩阵的元素在所述相似矩阵V中的列号构成邻域矩阵Vn 中的元素Vnij。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910242427.1/1.html,转载请声明来源钻瓜专利网。