[发明专利]基于层次化分类体系的情感判别和重要性划分方法有效

专利信息
申请号: 201810394797.6 申请日: 2018-04-27
公开(公告)号: CN108804524B 公开(公告)日: 2020-03-27
发明(设计)人: 冯翱;徐天豪;吴锡 申请(专利权)人: 成都信息工程大学;成都智睿通拓科技有限公司
主分类号: G06F16/35 分类号: G06F16/35
代理公司: 成都智涌知识产权代理事务所(普通合伙) 51313 代理人: 周正辉
地址: 610000 四川省成都*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 层次 化分 体系 情感 判别 重要性 划分 方法
【权利要求书】:

1.一种基于层次化分类体系的情感判别和重要性划分方法,其特征在于,其包括:

S1)采集垂直领域的新闻数据,其内容多样化;

S2)分析垂直领域,根据层次化分类的思想对该领域进行层次化划分,划分后的垂直领域由树状图表示,出现频率/概率高的细分领域被划分为内节点和基类,每层包含一个“其他”节点,归类出现频率低的细分领域;

S3)针对每层中的内节点和基类,选取新闻数据,由专业人员进行人工标注,其中数据量的选取应满足节点分类器的训练要求;

S4)对于每个内节点和基类,使用S3中标注好的训练数据建立分类器,分类器输出新进新闻属于该节点的概率,每个节点设置一个门限值Pmin;

S5)对于新采集到的新闻数据,使用S4中建立的分类器计算其属于每个节点的概率,将其归类于概率最大或超过门限值的节点,从而使得新闻数据被归类到内节点或基类;根据Naive Bayes分类方法计算新闻数据属于特定节点的概率:

其中,di表示任意新闻数据,cj表示节点;对di进行分类,就是将di放入概率值最大的节点,即:

S6)将新闻数据归类到节点后,根据匹配到的情感词的情感倾向及词频,确定该新闻数据的情感和重要性标签。

2.如权利要求1所述的方法,其特征在于,在S4中,所述 分类器采用的分类算法包括:支持向量机、贝叶斯模型、决策树和神经网络算法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学;成都智睿通拓科技有限公司,未经成都信息工程大学;成都智睿通拓科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810394797.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top