[发明专利]一种情感词语文本信息分类方法在审

专利信息
申请号: 201911341489.8 申请日: 2019-12-24
公开(公告)号: CN111104515A 公开(公告)日: 2020-05-05
发明(设计)人: 李春燕;苏航;李松和;武传涛;刘瑞欣 申请(专利权)人: 山东众志电子有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/284;G06F40/242
代理公司: 暂无信息 代理人: 暂无信息
地址: 271000 山东省泰安市高新*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 情感 词语 文本 信息 分类 方法
【说明书】:

发明公开了一种情感词语文本信息分类方法,包括:获取文本信息;输入文本词语;判断词性,所述判断文本中词性分为情感词、否定词、程度副词;情感词打分,情感词输入情感词词典打分,得到分值1;判断情感词前后,判断情感词前后是否对应程度副词;得到新的情感词分值2;再次判断情感词前后,得到情感词分值3;输出文本最终得分,各情感词最终得分之和;根据文本最终得分划分文本类别。本发明旨在建立一个文本信息分类模型,目的是对文本进行情感色彩打分,进而将文本划分为正向、中立、负向三个类别。

技术领域

本发明涉及文本信息分类技术领域,具体为一种情感词语文本信息分类方法。

背景技术

情感分类是自然语言处理(Natural Language Processing,NLP)领域中的一个典型问题,问题的描述为,给定一段文字(可以是一句话或一篇文章),判断这篇文章所表达的情感是正向、负向还是中性的。

情感分类问题本身是一个无论学术界还是工业界都广泛深入研究的话题。利用情感字典是一种解决情感分类问题的方法。首先人为设定一些情感词,如正向情感词、负向情感词,之后通过统计输入文本的正、负向情感词的占比来决定文本的情感分类。

分数绝对值低的部分样本判断准确性不算高,分类不够明确。

分析文本情感色彩时没有考虑语境和句间关系,容易误判如讽刺性文本等特殊文本。

发明内容

本发明的目的在于解决现有技术方案中存在的问题。

本发明解决其技术问题所采用的技术方案是:

一种情感词语文本信息分类方法,包括:

获取文本信息;

输入文本词语;

判断词性,所述判断文本中词性分为情感词、否定词、程度副词;

情感词打分,情感词输入情感词词典打分,得到分值1;

判断情感词前后,判断情感词前后是否对应程度副词;

得到新的情感词分值2;

再次判断情感词前后,得到情感词分值3;

输出文本最终得分,各情感词最终得分之和;

根据文本最终得分划分文本类别。

进一步的,还包括文本词典,所述文本词典包含建立情感词典、否定词词典和程度副词词典,将每个文本对象的单词列表中的词归类,生成此个文本对象的情感词词典、否定词词典和程度副词词典。

进一步的,所述情感词典包括正向情感词和负向情感词,程度副词词典和情感词有分值,否定词没有分值。

进一步的,还包含了建立文本数据集,人工对每一个文本对象做标记,划分该文本的情感分类,分为正向、中立、负向3类,分别标记为1、0、-1,每个文本对象利用结巴分词进行处理并根据停用词词典去除停用词,得到每个文本的单词列表。

进一步的,判断情感词前后分数计算范围为两个情感词之间的否定词和程度副词与其中后一个情感词构成一个情感词组,所有情感词组的得分之和即为文本的情感极性得分。公式如下:

其中ai为第i个情感词组中的否定词词数,bi为此词组中所有程度副词的权值之积,ci为情感副词的得分。

本发明的有益效果是:本技术方案中通过对文本进行情感色彩打分,在实施过程中对文本进行情感色彩打分,进而将文本划分为正向、中立、负向三个类别,并且与文本数据集中文本对象标记对比,还可以随时补入更新后的开源性词典。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东众志电子有限公司,未经山东众志电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911341489.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top