[发明专利]一种基于中文语义结构和细分词库结合的情感分析方法有效
申请号: | 201510525999.6 | 申请日: | 2015-08-25 |
公开(公告)号: | CN105095190B | 公开(公告)日: | 2018-01-12 |
发明(设计)人: | 施建旭;王新蕾 | 申请(专利权)人: | 众联数据技术(南京)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京智为时代知识产权代理事务所(普通合伙)11498 | 代理人: | 王加岭 |
地址: | 210000 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 中文 语义 结构 细分 词库 结合 情感 分析 方法 | ||
1.一种基于中文语义结构和细分词库结合的情感分析方法,其特征在于,所述情感分析方法包括:
1)在计算机系统中输入至少由一个语句组成的待测文本;
2)通过计算机系统的分词模块对待测文本的每一语句进行分词处理,标注每一语句中的情感词和其它词,其中,
所述分词模块通过计算机中存储的字典,标注每一语句中的情感词和其它词,所述字典中词汇被分类为情感词类和其它词类;
所述字典中情感词汇的分类标注表如下:
所述字典中其它词类标注表如下:
3)通过计算机系统的语义模式匹配模块,对经分词处理的待测文本进行匹配,得到每一语义单元的语义模式,其中,所述语义单元是指待测文本的每一语句中能够匹配语义模式的文本片段;
所述语义模式匹配表包括:
4)通过计算机系统的情感分析模块,将待测文本的每一语义单元的语义模式对应为情感值,
并将文本中所有语义单元的情感值进行累加,得到待测文本的情感值,其中,
当某一语句中出现没有匹配语义模式的剩余的否定词时,该语句中否定词之后的语义单元的情感值×(-1),再参与所述文本中所有语义单元的情感值累加的计算;
当某一语句中出现没有匹配语义模式的剩余的反转词时,该语句中反转词之后的语义单元的情感值×2,再参与所述文本中所有语义单元的情感值累加的计算;
当某一语句中出现没有匹配语义模式的剩余的否定词和反转词时,该语句中否定词和反转词之后的语义单元的情感值×(-1)×2,再参与所述文本中所有语义单元的情感值累加的计算;
5)当待测文本的情感值大于1的时候,判定待测文本的情感值为正面,标注为1,
当待测文本的情感值小于1的时候,判定待测文本的情感值为负面,标注为-1,
无模式匹配或叠加情感为0时,判定待测文本的情感为中性,标注为0。
2.根据权利要求1所述的情感分析方法,其特征在于,所述待测文本包括以唯一句子结束符结尾的待测文本或者含有多个句子结束符的待测文本;
所述待测文本的输入采用网络爬虫在网络中抓取、切分得到。
3.根据权利要求1所述的情感分析方法,其特征在于,所述字典还包括从爬虫抓取的近五万条财经评论短文本的网络常用财经词汇和其他网络情感术语。
4.根据权利要求1所述的情感分析方法,其特征在于,所述分词模块采用双向最大匹配算法识别待测文本中长短词汇或短语。
5.根据权利要求1所述的情感分析方法,其特征在于,所述语义模式匹配模块采用最右优先匹配算法:从待测文本中语句的END结束符开始,自右向左扫描整个语句,与语义模式匹配表中预设的模式进行匹配。
6.根据权利要求1所述的情感分析方法,其特征在于,采用最长匹配的原则,即匹配语义模式匹配表中的长模式,得到模式对应的情感值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众联数据技术(南京)有限公司,未经众联数据技术(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510525999.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理方法以及信息处理装置
- 下一篇:对用户评价进行处理的方法及装置