[发明专利]一种基于深度学习和特征融合的文本情感分类方法在审
申请号: | 201911003328.8 | 申请日: | 2019-10-21 |
公开(公告)号: | CN110750648A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 李传艺;葛季栋;孔力;冯奕;周筱羽;骆斌 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于深度学习和特征融合的文本情感分类方法,该方法通过整合层次特征学习文本表示,包括:根据文本极性及否定词,为情感词设计不同环境的向量表示;为词性采样得到向量区分同形词;结合表情符优化词向量,使用神经网络模型学习基于词向量的单句特征;通过字序列学习基于字向量的单句特征;两部分拼接得到句子级特征;对于至少包含两个单句的文档,句向量序列输入到上层神经网络学习基于神经网的文档特征,并对段首、段尾和包含总结词的句子取平均获得基于规则的文档特征,两部分拼接获得文档级特征。针对具体任务,将单句或文档特征输入随机森林分类器即可预测情感类别。与基础模型相比,本发明能够有效提高文本情感分类的准确性。 | ||
搜索关键词: | 文档特征 文本情感分类 词向量 文档 向量 拼接 句子 学习 随机森林分类器 神经网络模型 神经网络学习 层次特征 基础模型 情感类别 特征融合 文本表示 向量表示 向量序列 情感词 神经网 字序列 采样 词性 段尾 整合 表情 文本 上层 预测 优化 | ||
【主权项】:
1.一种基于深度学习和特征融合的文本情感分类方法,其特征在于包含以下步骤:/n步骤(1)语料预处理;/n步骤(2)向量预训练;/n步骤(3)对情感词选取环境特定的情感词向量;/n步骤(4)以多种特征作为输入,获得单句特征;/n步骤(5)以单句特征序列作为输入,获得文档特征;/n步骤(6)分别输出单句情感类别和文档情感类别。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911003328.8/,转载请声明来源钻瓜专利网。