[发明专利]一种基于中文语义结构和细分词库结合的情感分析方法有效
申请号: | 201510525999.6 | 申请日: | 2015-08-25 |
公开(公告)号: | CN105095190B | 公开(公告)日: | 2018-01-12 |
发明(设计)人: | 施建旭;王新蕾 | 申请(专利权)人: | 众联数据技术(南京)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京智为时代知识产权代理事务所(普通合伙)11498 | 代理人: | 王加岭 |
地址: | 210000 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于中文语义结构和细分词库结合的情感分析方法,所述情感分析方法包括1)在计算机系统中输入至少由一个语句组成的待测文本;2)对待测文本的每一语句进行分词处理,标注每一语句中的情感词和其它词;3)对经分词处理的待测文本进行匹配,得到每一语义单元的语义模式;4)将待测文本的每一语义单元的语义模式对应为情感值,并将文本中所有语义单元的情感值进行累加,得到待测文本的情感值。本发明从非结构化文本中切分出情感词、连接词、转折词等,根据各词的实际排列,匹配句型模式,得到语义单元情感值,根据语义单元情感值综合计算句子情感值,达到量化财经新闻评论句子情感值的目的。 | ||
搜索关键词: | 一种 基于 中文 语义 结构 细分 词库 结合 情感 分析 方法 | ||
【主权项】:
一种基于中文语义结构和细分词库结合的情感分析方法,其特征在于,所述情感分析方法包括:1)在计算机系统中输入至少由一个语句组成的待测文本;2)通过计算机系统的分词模块对待测文本的每一语句进行分词处理,标注每一语句中的情感词和其它词,其中,所述分词模块通过计算机中存储的字典,标注每一语句中的情感词和其它词,所述字典中词汇被分类为情感词类和其它词类;所述字典中情感词汇的分类标注表如下:所述字典中其它词类标注表如下:3)通过计算机系统的语义模式匹配模块,对经分词处理的待测文本进行匹配,得到每一语义单元的语义模式,其中,所述语义单元是指待测文本的每一语句中能够匹配语义模式的文本片段;所述语义模式匹配表包括:4)通过计算机系统的情感分析模块,将待测文本的每一语义单元的语义模式对应为情感值,并将文本中所有语义单元的情感值进行累加,得到待测文本的情感值,其中,当某一语句中出现没有匹配语义模式的剩余的否定词时,该语句中否定词之后的语义单元的情感值×(‑1),再参与所述文本中所有语义单元的情感值累加的计算;当某一语句中出现没有匹配语义模式的剩余的反转词时,该语句中反转词之后的语义单元的情感值×2,再参与所述文本中所有语义单元的情感值累加的计算;当某一语句中出现没有匹配语义模式的剩余的否定词和反转词时,该语句中否定词和反转词之后的语义单元的情感值×(‑1)×2,再参与所述文本中所有语义单元的情感值累加的计算;5)当待测文本的情感值大于1的时候,判定待测文本的情感值为正面,标注为1,当待测文本的情感值小于1的时候,判定待测文本的情感值为负面,标注为‑1,无模式匹配或叠加情感为0时,判定待测文本的情感为中性,标注为0。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众联数据技术(南京)有限公司,未经众联数据技术(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510525999.6/,转载请声明来源钻瓜专利网。
- 上一篇:信息处理方法以及信息处理装置
- 下一篇:对用户评价进行处理的方法及装置