[发明专利]一种地理信息服务元数据文本多层级多标签分类方法有效

申请号：	201910942287.2	申请日：	2019-09-30
公开（公告）号：	CN110704624B	公开（公告）日：	2021-08-10
发明（设计）人：	桂志鹏;张敏;彭德华;吴华意	申请（专利权）人：	武汉大学
主分类号：	G06F16/35	分类号：	G06F16/35;G06F16/387;G06F16/34;G06F40/284;G06F40/30;G06K9/62
代理公司：	湖北武汉永嘉专利代理有限公司 42102	代理人：	李丹
地址：	430072 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种地理信息服务元数据文本多层级多标签分类方法，包括：1)获取地理信息服务元数据文本集进行文本预处理，将每条数据样本划分为文本特征词组合；2)设定一级分类目录，生成与分类类别语义关联的典型词词表；3)根据典型词词表对文本特征词进行筛选；4)选取ML‑KNN作为协同训练的一个基模型；5)建立主题预测模型ML‑CSW作为协同训练的另一基模型；6)设计协同机制，为元数据文本匹配多标签主题，作为一级粗粒度主题分类结果；7)选取某一分类标签对应的元数据文本，得到不同级别的细粒度主题类别目录。本发明方法考虑地理信息服务元数据的领域特色和文本语义，仅依赖少量的标记数据样本且分类结果相比传统多标签分类方法整体表现更好。
搜索关键词：	一种地理信息服务数据文本多层标签分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种地理信息服务元数据文本多层级多标签分类方法，其特征在于，包括以下步骤：/n1)获取包含未标记样本与标记样本的地理信息服务元数据文本集进行文本预处理，将每条数据样本划分为文本特征词组合；/n2)基于地理信息资源的领域应用主题类别设定一级分类目录，获得分类类别，即主题，然后生成与分类类别语义关联的典型词词表；/n3)根据典型词词表对文本特征词进行筛选，滤除与典型词距离大于阈值的特征，获得根据主题分类筛选的特征子集；/n4)选取经典多标签分类算法ML-KNN作为协同训练的一个基模型，记为H

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉大学，未经武汉大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910942287.2/，转载请声明来源钻瓜专利网。

上一篇：基于Rasa_Nlu框架提高实体识别率的方法、装置、系统和存储介质
下一篇：一种基于CAD图纸信息批量自动处理方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种地理信息服务元数据文本多层级多标签分类方法有效

专利文献下载