[发明专利]一种跨语言情感分类方法在审
申请号: | 201310533688.5 | 申请日: | 2013-10-31 |
公开(公告)号: | CN103530286A | 公开(公告)日: | 2014-01-22 |
发明(设计)人: | 李寿山;汪蓉;周国栋 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语言 情感 分类 方法 | ||
1.一种跨语言情感分类方法,其特征在于,包括以下步骤:
S1、从语料库获取预设数目的已标注英文语料以及未标注的中文语料,将已标注的英文语料翻译成中文语料,并进行标注;
S2、从所述中文语料中提取已标注部分,将所述中文语料中剩余的未标注部分进行情感分类;
S3、根据已标注中文语料中正类分类正确的样本数P、已标注中文语料中负类分类正确的样本数N,以及中文语料的总样本数A,计算分类准确率。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1中,所述英文语料及中文语料是从电子领域的语料库获取,同时还获取中文测试语料。
3.根据权利要求1所述的方法,其特征在于,所述步骤S1中,使用计算机将已标注的英文语料翻译成中文语料,并进行标注。
4.根据权利要求1所述的方法,其特征在于,所述步骤S2中,使用self-traning方法将所述中文语料中剩余的未标注部分进行半监督的情感分类。
5.根据权利要求4所述的方法,其特征在于,在所述self-traning方法中,使用最大熵分类器对所述中文语料进行分类。
6.根据权利要求1所述的方法,其特征在于,所述步骤S3中,计算分类准确率的公式为准确率=(P+N)/A。
7.根据权利要求1所述的方法,其特征在于,所述英文语料及中文语料均为已知情感极性的语料。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310533688.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:车载灯具
- 下一篇:照明装置和包括该照明装置的改型灯