[发明专利]一种基于细粒度情感词典的心理预警模型构建方法有效

申请号：	201610286515.1	申请日：	2016-04-29
公开（公告）号：	CN105956095B	公开（公告）日：	2019-11-05
发明（设计）人：	于瑞国;林榆旺;王建荣;于健;喻梅;刘江月	申请（专利权）人：	天津大学
主分类号：	G06F16/35	分类号：	G06F16/35;G06F17/27
代理公司：	天津市北洋有限责任专利代理事务所 12201	代理人：	李素兰
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于细粒度情感词典的心理预警模型构建方法，该方法包括：步骤(1)、利用翻译的方法得到ANEW词典对应的中文词典；步骤(2)、词汇筛选，删除步骤(1)得到的中文词典中不适用于情感分析的词汇；步骤(3)、进行情感值的归一化处理，将词语的情感值归一化到‑1～1之间，步骤(4)、基于同义词林扩展版进行情感词典的扩充；步骤(5)、基于改进的SO‑PMI算法进行词典的扩充；步骤(6)、对于微博文本进行基于规则的情感倾向性分析；步骤(7)、执行基于权重因子的情感分析算法。与现有技术相比，本发明不受语料数量的限制，可以实现完全无监督的执行，非常适合微博大量且无标记的数据。
搜索关键词：	一种基于细粒度情感词典心理预警模型构建方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于细粒度情感词典的心理预警模型构建方法，其特征在于，该方法以下步骤：步骤(1)、利用翻译的方法得到ANEW词典对应的中文词典；步骤(2)、词汇筛选，删除步骤(1)得到的中文词典中不适用于情感分析的词汇；步骤(3)、进行情感值的归一化处理，将词语的情感值归一化到‑1～1之间，归一化公式表示为：其中，Avevalue表示情感强度的平均值，Maxvalue表示情感词所在类别的强度最大值，Minvalue表示情感词所在类别强度的最小值，X表示改词的情感强度，Y表示归一化后的情感强度；步骤(4)、基于同义词林扩展版进行情感词典的扩充，过滤掉语料库中出现频率极低的词汇，构建出更高效的情感词典；采用哈工大同义词词林的词汇相似度算法，并结合已有的语义词典进行计算词汇语义相似度；步骤(5)、基于改进的SO‑PMI算法进行词典的扩充，具体处理如下：依据下式：SO(word)＝max(W_i(word))w_ij其中，其中，γ是调解系数，w_ij表示第i类情感类别中第j个基准词，W_i(word)表示新词word在与第i类情感词的SO‑PMI值；对于新词word在不同类中计算得到的SO‑PMI值，选择其中具有最大的SO‑PMI的新词word；步骤(6)、对于微博文本进行基于规则的情感倾向性分析，包括分词处理、对文本抽取规则进行扩充、将极性词进行转移、对程度副词进行处理、对于否定词+程度副词+情感词的结构和程度副词+否定词+情感词的结构进行分析处理，赋予不同的权重；步骤(7)、执行基于权重因子的情感分析算法，该算法公式表示为：其中，SO(S)是语句S的情感倾向值(Sentiment Orientation)，W_ij代表第i个属于情感类别j的情感词W的情感值，C_i是指修饰该情感词的权重因子，α为调解系数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610286515.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于细粒度情感词典的心理预警模型构建方法有效

专利文献下载