[发明专利]文本分类方法、装置及处理器有效
申请号: | 201310308226.3 | 申请日: | 2013-07-22 |
公开(公告)号: | CN103345525A | 公开(公告)日: | 2013-10-09 |
发明(设计)人: | 李寿山;高伟;周国栋 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及自然语言处理及模式识别技术领域,公开了一种文本分类方法、装置及处理器。该方法中,首先根据分类器获取情感测试样本和情绪测试样本分别属于各个情感类别和各个情绪类别的初始概率,继而选取情感测试样本和情绪测试样本作为共同样本,并获取所述共同样本的联合概率,将所述联合概率和初始概率进行加权求和,并根据求和的结果获取待分类文本所属的情感类别,和/或情绪类别。这个过程中,将待分类文本的情感和情绪进行联合,以实现对文本的情感分类,和/或情绪分类。由于同一文本的情感和情绪之间有着密切的联系,在将待分类文本的情感和情绪联合,以对待分类文本进行分类时,能有效提高文本分类的精度。 | ||
搜索关键词: | 文本 分类 方法 装置 处理器 | ||
【主权项】:
一种文本分类方法,其特征在于,包括:获取分类器,所述分类器包括:情感分类器和情绪分类器;获取待分类文本的情感测试样本和情绪测试样本,根据所述分类器,对所述情感测试样本和情绪测试样本进行分类,并获取所述情感测试样本和情绪测试样本分别属于各个情感类别和各个情绪类别的初始概率;选取情感测试样本和情绪测试样本作为共同样本,并获取所述共同样本的联合概率,所述联合概率包括:情感联合概率,和/或情绪联合概率,其中,所述情感联合概率p(si|ej)表示:某个样本的情绪类别为ej的情况下,其情感类别为si的概率,所述情绪联合概率p(ei|sj)表示:某个样本的情感类别为sj的情况下,其情绪类别为ei的概率;对所述初始概率和联合概率进行加权求和,并根据加权求和的结果获取待分类文本所属的情感类别,和/或情绪类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310308226.3/,转载请声明来源钻瓜专利网。