[发明专利]一种基于固定主题的文本情感倾向性分类方法有效
申请号: | 201610485392.4 | 申请日: | 2016-06-28 |
公开(公告)号: | CN106202200B | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 邵玉斌;王丽霞;刘彩;王晨歌;杜庆治 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于固定主题的文本情感倾向性分类的方法,属于文本情感倾向性分类领域。首先找出句子的主题,根据主题在本句的位置分成两步分别计算此主题前后的情感倾向,最终再计算出此主题的情感倾向。利用特征情感符号和通用情感词典找出句子中的情感符号;在主题词与情感符号之间找否定词和程度副词并计算其对此情感符号的影响;在情感符号之间找连接关系并计算本主题的情感倾向。本发明能帮助用户得到其他用户对某一产品、服务、事件或人物重要属性的倾向程度,并细分出相关用户对此产品、事件或人物各特征方面的情感倾向。 | ||
搜索关键词: | 一种 基于 固定 主题 文本 情感 倾向性 分类 方法 | ||
【主权项】:
1.一种基于固定主题的文本情感倾向性分类方法,其特征在于,包括以下步骤:步骤(1)划分中文文本中句子的组成成分将句子划分为四种成分,包括主题T、情感符号S、修饰情感符号的程度副词W、修饰情感符号的否定词P;步骤(2)建立特征属性等式,找出中文文本中所有主题T;步骤(3)找出每个主题T常用的特征情感符号和通用情感词典,按照积极和消极为情感符号赋值Ds;步骤(4)按句子顺序,找出中文文本中第一个主题T1,在主题T1后面从特征情感符号和通用情感词典找出第一个情感符号S1,其情感倾向值为步骤(3)中对应的情感符号赋值Ds,没有情感符号则情感倾向值为0并继续查找下一主题;步骤(5)在第一个主题T1与第一个情感符号S1之间找出所有的否定词P和程度副词W,并记录其位置PID和WID,计算第一个情感符号S1的情感倾向值①否定词P的个数为偶数时:②否定词P的个数为奇数时:其中DS为情感符号的赋值,Dw表示程度副词的赋值,WID为程度副词的位置,PID为离S最近的否定词的位置;步骤(6)在第一个情感符号S1后面继续查找第二个情感符号S2,按照步骤(4)和(5)计算第二个情感符号S2的情感倾向值并按照两者之间的连接关系计算第一个主题T1后面的情感倾向值,若第一个情感符号S1后面没有其他情感符号则查找下一主题;①并列关系:第一个主题T1后面的情感倾向值为第一个情感符号S1和第二个情感符号S2的情感倾向值之和;②转折关系:第一个主题T1后面的情感倾向值为第二个情感符号S2的情感倾向值;步骤(7)继续顺序查找句子中其他情感符号直至句末或下一个主题词,并按照步骤(6)计算出第一个主题T1后总的情感倾向值步骤(8)查找第一个主题T1前面的情感符号,并按步骤(4)‑(7)计算第一个主题T1前面的情感倾向值步骤(9)计算第一个主题T1的情感倾向值步骤(10)依次查找其他主题并计算情感倾向值,每一句的情感倾向值通过本句中所有主题的情感倾向值之和判断。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610485392.4/,转载请声明来源钻瓜专利网。