[发明专利]一种细粒度文本情感分析方法有效
申请号: | 201410178056.6 | 申请日: | 2014-04-25 |
公开(公告)号: | CN103995803B | 公开(公告)日: | 2017-07-04 |
发明(设计)人: | 於志文;夏云云;郭斌;周兴社;王柱 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种细粒度文本情感分析方法,步骤一构建细粒度情感词典;步骤二语句结构关系判断;步骤三简单句的情感值评定。本发明可以提取出文本所包含的更多的用户情感相关信息,能更好的刻画用户内心的感受,用于支撑相关的应用研究,例如基于健康的用户情绪状态及变化情况分析。 | ||
搜索关键词: | 一种 细粒度 文本 情感 分析 方法 | ||
【主权项】:
一种细粒度文本情感分析方法,其特征在于,包括以下步骤:步骤一:构建细粒度情感词典选取国际级公认的基准情感分类作为细粒度情感分类,并将基准情感词作为各类别的种子情感词,通过wordNet查找其同义词集合,并放入对应的类别,完成细粒度情感词典的第一步扩建;wordNet将单词分为四类:名词、动词、副词和形容词;由基准情感词扩展得到了名词性情感集合,按照相同的方式根据基准情感词的形容词、动词和副词形式,分别构建成其形容词、动词和副词形式的情感集合;同类别的情感集合,除了词性的差异之外,并不影响情感值的计算,则将一个类别下的情感集合视为一个大类,从而完成细粒度情感词典的第二步扩建;至此,构建的细粒度情感词典还有大部分的情感词汇无法覆盖;将其余情感词如何归类到细粒度情感类别的问题,转换为分析其与基准情感词在概念层次上基于常识的相似性,并将其分配到相似性最高的基准情感词所代表的情感类别中;最后分析归类结果,并完善可能存在的缺陷;至此完成细粒度情感词典的扩建;步骤二:语句结构关系判断判断语句中是否有连词,如果有,则表示该句为复合句,根据句间关系规则获得该连词表示的语句结构关系及语句情感值的计算规则;如果没有,则该语句是简单句;步骤三:情感值评定如果是复合句,则拆分为两个分句进行处理;如果为简单句,则直接计算其情感值;评论情感值计算要考虑与主题词的相关性,与主题词无关的情感词会给情感值计算带来干扰;而主题词主要通过语句的主语和宾语体现,则只需考虑与主语和宾语相关的名词性和形容词性情感词;根据句子结构、依赖关系、情感词褒贬度及相关副词修饰强度,计算出简单句的情感值;对于评论经常出现的不完整短句,利用单词词性,提高依赖关系判断的准确性;当情感词前的修饰短语过长时,将句子结构、单词词性及依赖关系结合起来,具体方法如下:先探测依赖关系,找出主题词,进而找出依附于主题词的修饰短语,根据句子结构分析的结果得到主题词与其修饰短语构成的名词性短语,然后分析此名词性短语的结构和修饰短语所包含的词的词性,得出正确的依赖关系;步骤四:评论文本细粒度情感计算结合句型和句间关系规则获得语句情感值;所有语句的情感值之和为评论文本的整体情感值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410178056.6/,转载请声明来源钻瓜专利网。