[发明专利]一种基于深度学习和特征融合的文本情感分类方法在审

专利信息
申请号: 201911003328.8 申请日: 2019-10-21
公开(公告)号: CN110750648A 公开(公告)日: 2020-02-04
发明(设计)人: 李传艺;葛季栋;孔力;冯奕;周筱羽;骆斌 申请(专利权)人: 南京大学
主分类号: G06F16/35 分类号: G06F16/35;G06K9/62;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 210093 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出一种基于深度学习和特征融合的文本情感分类方法,该方法通过整合层次特征学习文本表示,包括:根据文本极性及否定词,为情感词设计不同环境的向量表示;为词性采样得到向量区分同形词;结合表情符优化词向量,使用神经网络模型学习基于词向量的单句特征;通过字序列学习基于字向量的单句特征;两部分拼接得到句子级特征;对于至少包含两个单句的文档,句向量序列输入到上层神经网络学习基于神经网的文档特征,并对段首、段尾和包含总结词的句子取平均获得基于规则的文档特征,两部分拼接获得文档级特征。针对具体任务,将单句或文档特征输入随机森林分类器即可预测情感类别。与基础模型相比,本发明能够有效提高文本情感分类的准确性。
搜索关键词: 文档特征 文本情感分类 词向量 文档 向量 拼接 句子 学习 随机森林分类器 神经网络模型 神经网络学习 层次特征 基础模型 情感类别 特征融合 文本表示 向量表示 向量序列 情感词 神经网 字序列 采样 词性 段尾 整合 表情 文本 上层 预测 优化
【主权项】:
1.一种基于深度学习和特征融合的文本情感分类方法,其特征在于包含以下步骤:/n步骤(1)语料预处理;/n步骤(2)向量预训练;/n步骤(3)对情感词选取环境特定的情感词向量;/n步骤(4)以多种特征作为输入,获得单句特征;/n步骤(5)以单句特征序列作为输入,获得文档特征;/n步骤(6)分别输出单句情感类别和文档情感类别。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201911003328.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top