[发明专利]基于层次化分类体系的情感判别和重要性划分方法有效
申请号: | 201810394797.6 | 申请日: | 2018-04-27 |
公开(公告)号: | CN108804524B | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 冯翱;徐天豪;吴锡 | 申请(专利权)人: | 成都信息工程大学;成都智睿通拓科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 成都智涌知识产权代理事务所(普通合伙) 51313 | 代理人: | 周正辉 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于层次化分类体系的情感判别和重要性划分方法,其包括:S1)采集垂直领域的大量新闻数据,其内容尽可能多样化;S2)分析垂直领域,根据层次化分类的思想对该领域进行层次化划分,划分后的垂直领域由树状图表示;S3)针对每层中的内节点和基类,选取一定量的新闻数据进行人工标注;S4)对于每个内节点和基类,使用S3中标注好的训练数据建立分类器,分类器输出新进新闻属于该节点的概率;S5)对于新采集到的新闻数据,使用S4中建立的分类器计算其属于每个节点的概率,将其归类于概率最大或超过门限值的节点,从而使得新闻数据被归类到内节点或基类;S6)将新闻数据归类到节点后,计算并确定其情感和重要性标签。 | ||
搜索关键词: | 基于 层次 化分 体系 情感 判别 重要性 划分 方法 | ||
【主权项】:
1.一种基于层次化分类体系的情感判别和重要性划分方法,其特征在于,其包括:S1)采集垂直领域的大量新闻数据,其内容尽可能多样化;S2)分析垂直领域,根据层次化分类的思想对该领域进行层次化划分,划分后的垂直领域由树状图表示,出现频率/概率高的细分领域被划分为内节点和基类,每层包含一个“其他”节点,归类出现频率低的细分领域;S3)针对每层中的内节点和基类,选取一定量的新闻数据,由专业人员进行人工标注,其中数据量的选取应满足节点分类器的训练要求;S4)对于每个内节点和基类,使用S3中标注好的训练数据建立分类器,分类器输出新进新闻属于该节点的概率,每个节点设置一个门限值Pmin;S5)对于新采集到的新闻数据,使用S4中建立的分类器计算其属于每个节点的概率,将其归类于概率最大或超过门限值的节点,从而使得新闻数据被归类到内节点或基类;S6)将新闻数据归类到节点后,计算并确定其情感和重要性标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学;成都智睿通拓科技有限公司,未经成都信息工程大学;成都智睿通拓科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810394797.6/,转载请声明来源钻瓜专利网。
- 上一篇:数据同步方法、系统及计算机可读存储介质
- 下一篇:一种智能回答方法及装置