[发明专利]一种情感词语文本信息分类方法在审

专利信息
申请号: 201911341489.8 申请日: 2019-12-24
公开(公告)号: CN111104515A 公开(公告)日: 2020-05-05
发明(设计)人: 李春燕;苏航;李松和;武传涛;刘瑞欣 申请(专利权)人: 山东众志电子有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/284;G06F40/242
代理公司: 暂无信息 代理人: 暂无信息
地址: 271000 山东省泰安市高新*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 情感 词语 文本 信息 分类 方法
【权利要求书】:

1.一种情感词语文本信息分类方法,其特征在于,包括:

获取文本信息;

输入文本词语;

判断词性,所述判断文本中词性分为情感词、否定词、程度副词;

情感词打分,情感词输入情感词词典打分,得到分值1;

判断情感词前后,判断情感词前后是否对应程度副词;

得到新的情感词分值2;

再次判断情感词前后,得到情感词分值3;

输出文本最终得分,各情感词最终得分之和;

根据文本最终得分划分文本类别。

2.根据权利要求1所述的情感词语文本信息分类方法,其特征在于:还包括文本词典,所述文本词典包含建立情感词典、否定词词典和程度副词词典,将每个文本对象的单词列表中的词归类,生成此个文本对象的情感词词典、否定词词典和程度副词词典。

3.根据权利要求2所述的情感词语文本信息分类方法,其特征在于:所述情感词典包括正向情感词和负向情感词,程度副词词典和情感词有分值,否定词没有分值。

4.根据权利要求3所述的情感词语文本信息分类方法,其特征在于:还包含了建立文本数据集,人工对每一个文本对象做标记,划分该文本的情感分类,分为正向、中立、负向3类,分别标记为1、0、-1,每个文本对象利用结巴分词进行处理并根据停用词词典去除停用词,得到每个文本的单词列表。

5.根据权利要求1-4任意一项所述的情感词语文本信息分类方法,其特征在于:判断情感词前后分数计算范围为两个情感词之间的否定词和程度副词与其中后一个情感词构成一个情感词组,所有情感词组的得分之和即为文本的情感极性得分。公式如下:

其中ai为第i个情感词组中的否定词词数,bi为此词组中所有程度副词的权值之积,ci为情感副词的得分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东众志电子有限公司,未经山东众志电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911341489.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top