[发明专利]文本分类方法、装置及处理器有效
申请号: | 201310308226.3 | 申请日: | 2013-07-22 |
公开(公告)号: | CN103345525A | 公开(公告)日: | 2013-10-09 |
发明(设计)人: | 李寿山;高伟;周国栋 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分类 方法 装置 处理器 | ||
技术领域
本发明涉及自然语言处理及模式识别技术领域,特别是涉及一种文本分类方法、装置及处理器。
背景技术
在人类的活动中,人对事物的态度或观点,往往会受到情感和情绪的影响。其中,情感是人对客观事物是否满足自己的需要而产生的一种态度体验,包括积极、中级或消极等,而情绪是指人内在的心理反应与感受,例如喜、怒、哀和乐等。情感分类有助于了解用户的消费习惯与产品的优缺点,以便对产品评论进行分析与决策;有助于了解民众的满意度与诉求,及时发现社会热点问题;有助于分析当前社会的热点舆情信息,给用户、企业或政府机构等提供决策参考的依据。而情绪具有潜在的领域、主题与时期独立性的特点,通过人的情绪能够观察到人对事物的观点倾向。
有鉴于此,经常需要对文本进行情感分类或情绪分类。现有的情感分类方法和情绪分类方法,主要是在获取待分类文本后,对情感测试样本进行情感标注,对情绪测试样本进行情绪标注,并根据标注后的测试样本分别对待分类的文本分别进行情感分类或情绪分类。
但是,发明人在本申请的研究过程中发现,采用上述方式对待分类文本进行情感分类或情绪分类时,获取到的分类结果精度较低。
发明内容
有鉴于此,本发明的目的在于提供一种文本分类方法、装置及处理器,具体实施方案如下:
一种文本分类方法,包括:
获取分类器,所述分类器包括:情感分类器和情绪分类器;
获取待分类文本的情感测试样本和情绪测试样本,根据所述分类器,对所述情感测试样本和情绪测试样本进行分类,并获取所述情感测试样本和情绪测试样本分别属于各个情感类别和各个情绪类别的初始概率;
选取情感测试样本和情绪测试样本作为共同样本,并获取所述共同样本的联合概率,所述联合概率包括:情感联合概率,和/或情绪联合概率,其中,所述情感联合概率p(si|ej)表示:某个样本的情绪类别为ej的情况下,其情感类别为si的概率,所述情绪联合概率p(ei|sj)表示:某个样本的情感类别为sj的情况下,其情绪类别为ei的概率;
对所述初始概率和联合概率进行加权求和,并根据加权求和的结果获取待分类文本所属的情感类别,和/或情绪类别。
优选的,对所述初始概率和联合概率进行加权求和,并根据加权求和的结果获取待分类文本所属的情感类别,包括:
根据所述共同样本的初始概率和情感联合概率,获取各个共同样本的情感转移概率,其中,获取所述情感转移概率的算法为:
其中,p(ej|X)为共同样本X属于各类情绪类别的初始概率,p(si|ej)为情感联合概率,即为某个共同样本的情绪类别为ej时,情感类别为si的概率,Ne为情绪分类的情绪类别个数,ptransfer(si|X)为样本X的情感转移概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310308226.3/2.html,转载请声明来源钻瓜专利网。