[发明专利]一种情感词语文本信息分类方法在审
申请号: | 201911341489.8 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111104515A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 李春燕;苏航;李松和;武传涛;刘瑞欣 | 申请(专利权)人: | 山东众志电子有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/284;G06F40/242 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 271000 山东省泰安市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 情感 词语 文本 信息 分类 方法 | ||
1.一种情感词语文本信息分类方法,其特征在于,包括:
获取文本信息;
输入文本词语;
判断词性,所述判断文本中词性分为情感词、否定词、程度副词;
情感词打分,情感词输入情感词词典打分,得到分值1;
判断情感词前后,判断情感词前后是否对应程度副词;
得到新的情感词分值2;
再次判断情感词前后,得到情感词分值3;
输出文本最终得分,各情感词最终得分之和;
根据文本最终得分划分文本类别。
2.根据权利要求1所述的情感词语文本信息分类方法,其特征在于:还包括文本词典,所述文本词典包含建立情感词典、否定词词典和程度副词词典,将每个文本对象的单词列表中的词归类,生成此个文本对象的情感词词典、否定词词典和程度副词词典。
3.根据权利要求2所述的情感词语文本信息分类方法,其特征在于:所述情感词典包括正向情感词和负向情感词,程度副词词典和情感词有分值,否定词没有分值。
4.根据权利要求3所述的情感词语文本信息分类方法,其特征在于:还包含了建立文本数据集,人工对每一个文本对象做标记,划分该文本的情感分类,分为正向、中立、负向3类,分别标记为1、0、-1,每个文本对象利用结巴分词进行处理并根据停用词词典去除停用词,得到每个文本的单词列表。
5.根据权利要求1-4任意一项所述的情感词语文本信息分类方法,其特征在于:判断情感词前后分数计算范围为两个情感词之间的否定词和程度副词与其中后一个情感词构成一个情感词组,所有情感词组的得分之和即为文本的情感极性得分。公式如下:
其中ai为第i个情感词组中的否定词词数,bi为此词组中所有程度副词的权值之积,ci为情感副词的得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东众志电子有限公司,未经山东众志电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911341489.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种安全通信方法和系统
- 下一篇:一种耐磨电梯安全钳块
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置