[发明专利]一种用于弹幕情感分析且基于表情和语气的情感词典构建方法在审
申请号: | 202010937693.2 | 申请日: | 2020-09-08 |
公开(公告)号: | CN112115707A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 崔宗敏;邱全磊;肖彦;王立华;杨潇;吕小蕾 | 申请(专利权)人: | 九江学院 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/279;G06Q50/00 |
代理公司: | 南昌新天下专利商标代理有限公司 36115 | 代理人: | 谢德珍 |
地址: | 332000 *** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 弹幕 情感 分析 基于 表情 语气 词典 构建 方法 | ||
1.一种用于弹幕情感分析且基于表情和语气的情感词典构建方法,其特征在于,首先构建传统情感词典TD,而后在传统情感词典TD上添加构建的表情词典E与语气词典T以获得新词典BSET;同时为区分具有相同情感词的不同弹幕,构建程度词典DD和否定词典ND并添加至新词典BSET中,最后对基于程度词典DD和否定词典ND构建的所有情感词典进行修正,并将修正后的情感值用于弹幕情感分析。
2.根据权利要求1所述的一种用于弹幕情感分析且基于表情和语气的情感词典构建方法,其特征在于,具体步骤如下:
(1)构建传统情感词典
首先构建传统情感词典TD,TD={基础情感词典,领域词典,字段词典,网络词典,程度词典,否定词典};
(2)构建表情词典
表情词典E由一组表情构成,E具有三个属性:符号、类别和情感值,令S为E中的符号集合,C为类别的集合,E.V为情感值的集合,s∈S,c∈C,v∈E.V,表情e=(e.s,e.c,e.v),同时,定义e.v∈[-3,3]∩e.v∈N;表情e的情感值计算如下:
首先,而后计算两个表情之间的相关程度,如公式(1)所示:
公式(1)中,ECD为表情相关度的缩写,B(e1,e2)表示两个表情e1和e2一起出现的弹幕数量,B(e1)和B(e2)表示两个表情单独出现的弹幕数量;
其次,设置一组正向表情PE和一组负向表情NE,且如公式(2)所示计算表情e的情感倾向EST:
最后,定义低阈值与高阈值且计算表情e的情感值e.v,如公式(3)所示:
(3)构建语气词典
语气词典T由一组语气词构成,T具有语气词和情感值两个属性,令W为T中的语气词集合,T.V为情感值的集合,w∈W,v∈T.V,语气词t=(t.w,t.v);同时,定义t.v∈[-3,3]∩t.v∈N;
在传统情感词典TD上添加构建表情词典E与语气词典T,得到新词典BSET;
(4)构建程度词典和否定词典
为区分具有相同情感词的不同弹幕,在新词典BSET中构建程度词典DD和否定词典ND;
(5)对所有情感词典进行修正
对基于步骤(4)构建的所有情感词典进行修正,用于弹幕情感分析。
3.根据权利要求2所述的一种用于弹幕情感分析且基于表情和语气的情感词典构建方法,其特征在于,步骤(1)中,基础情感词典基于BosonNLP情感词典构建,领域词典基于SO-PMI算法构建,字段词典基于字段分类器构建,网络词典基于搜狗输入法词典构建。
4.根据权利要求2所述的一种用于弹幕情感分析且基于表情和语气的情感词典构建方法,其特征在于,步骤(2)中,公式(1)的计算将得到三个结果:①当ECD(e1,e2)>>0时,e1与e2具有相关性,若e1和e2之间存在相关性,则B(e1,e2)>B(e1)与B(e2),同时,ECD(e1,e2)越大,相关性越强;②ECD(e1,e2)<<0时,e1与e2互斥,同时ECD(e1,e2)的较大值显示两个表情更加互斥;③当ECD(e1,e2)≈0时,e1与e2独立,即e1与e2不相关或互斥。
5.根据权利要求2所述的一种用于弹幕情感分析且基于表情和语气的情感词典构建方法,其特征在于,步骤(2)中,公式(3)的计算结果:①当e.v>0时,e是积极表情;②当e.v=0时,e是中性表情;③当e.v<0时,e是消极表情。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于九江学院,未经九江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010937693.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种聚晶金刚石复合片和锚杆钻头
- 下一篇:一种施工升降机防坠保险支架