[发明专利]一种基于概念和文本情感的短文本情感分析方法和装置在审
申请号: | 201711488474.5 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108108468A | 公开(公告)日: | 2018-06-01 |
发明(设计)人: | 莫益军;杨帆;姚澜 | 申请(专利权)人: | 华中科技大学鄂州工业技术研究院;华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06K9/62 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 436000 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本情感 情感分析 概念特征 短文本 文本 概念特征向量 方法和装置 情感极性 特征向量 准确度 特征提取过程 信息处理技术 数据预处理 词性标注 技术效果 句法关系 情感词典 有效信息 语料库 构建 标注 词语 分类 分析 | ||
1.一种基于概念和文本情感的短文本情感分析方法,其特征在于,所述方法包括:
对短文本进行数据预处理;
根据依存句法关系获得文本概念特征;
根据构建情感词典和词性标注对词语进行情感标注,获得文本情感特征;
根据所述文本概念特征、所述文本情感特征,获得文本概念特征向量和文本情感特征向量;
根据所述文本概念特征向量和所述文本情感特征向量,确定最终情感极性类别。
2.如权利要求1所述的方法,其特征在于,所述对短文本进行数据预处理,还包括:
对所述短文本进行分词处理;
对所述短文本进行词性标注;
对所述短文本进行依存句法分析,获得包含依存关系的二元词组。
3.如权利要求1所述的方法,其特征在于,所述根据依存句法关系获得文本概念特征,还包括:
根据依存句法关系制定依赖规则;
根据依存句法和依赖规则制定抽取算法抽取文本概念特征。
4.如权利要求3所述的方法,其特征在于,所述依赖规则包括:
规则一:如果核心动词存在主谓关系,则抽取所述核心动词的主语;和/或,
规则二:如果所述核心动词存在动宾关系,则抽取所述核心动词的宾语;和/或,
规则三:如果所述核心动词的宾语词性依旧为动词,对所述核心动词和所述宾语进行合并,获得新的动词并继续寻找宾语动词的直接宾语,并抽取所述核心动词的直接宾语;和/或,
规则四:如果词语中存在形容词、副词、名词修饰词,则将所述形容词、副词、名词修饰词与所述词语合并,形成新的词语;和/或,
规则五:如果所述核心动词和所述词语属于并列关系,则认为所述词语也属于所述核心动词。
5.如权利要求1所述的方法,其特征在于,所述根据构建情感词典和词性标注对词语进行情感标注,获得文本情感特征,还包括:
根据情感词典,获得词语情感类别;
根据所述词语情感类别,获得情感标签类别表;
根据所述情感标签类别表,获得文本情感特征。
6.如权利要求1所述的方法,其特征在于,所述根据所述文本概念特征、所述文本情感特征,获得文本概念特征向量和文本情感特征向量,还包括:
根据Word2vec词向量学习、所述文本概念特征,获得文本概念特征向量;
根据Doc2vec词向量学习、所述文本情感特征,获得文本情感特征向量。
7.如权利要求1所述的方法,其特征在于,所述根据所述文本概念特征向量和所述文本情感特征向量,确定最终情感极性类别,还包括:
根据所述文本概念特征向量和所述文本情感特征向量进行特征融合,获得综合文本特征;
根据所述综合文本特征,确定最终情感极性类别。
8.如权利要求1所述的方法,其特征在于,所述根据所述文本概念特征向量和所述文本情感特征向量,确定最终情感极性类别,还包括:
根据所述文本概念特征向量训练SVM分类器,获得文本概念特征分类模型;
根据文本情感特征向量训练SVM分类器,获得文本情感特征分类模型;
根据所述文本概念特征分类模型、所述文本情感特征分类模型,对未知样本的类别概率分布进行加权,确定最终情感极性类别。
9.一种基于概念和文本情感的短文本情感分析装置,其特征在于,所述装置包括:
第一预处理单元,所述第一预处理单元用于对短文本进行数据预处理;
第一获得单元,所述第一获得单元用于根据依存句法关系获得文本概念特征;
第二获得单元,所述第二获得单元用于根据构建情感词典和词性标注对词语进行情感标注,获得文本情感特征;
第三获得单元,所述第三获得单元用于根据所述文本概念特征、所述文本情感特征,获得文本概念特征向量和文本情感特征向量;
第一确定单元,所述第一确定单元用于根据所述文本概念特征向量和所述文本情感特征向量,确定最终情感极性类别。
10.一种基于概念和文本情感的短文本情感分析装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
对短文本进行数据预处理;
根据依存句法关系获得文本概念特征;
根据构建情感词典和词性标注对词语进行情感标注,获得文本情感特征;
根据所述文本概念特征、所述文本情感特征,获得文本概念特征向量和文本情感特征向量;
根据所述文本概念特征向量和所述文本情感特征向量,确定最终情感极性类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学鄂州工业技术研究院;华中科技大学,未经华中科技大学鄂州工业技术研究院;华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711488474.5/1.html,转载请声明来源钻瓜专利网。