[发明专利]一种融合多模式的标签体系构建方法和系统有效

专利信息
申请号: 202110394477.2 申请日: 2021-04-13
公开(公告)号: CN113313344B 公开(公告)日: 2023-03-31
发明(设计)人: 李巍 申请(专利权)人: 武汉烽火众智数字技术有限责任公司
主分类号: G06Q10/0631 分类号: G06Q10/0631;G06F18/214;G06F18/24
代理公司: 北京汇泽知识产权代理有限公司 11228 代理人: 吴静
地址: 430074 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 融合 模式 标签 体系 构建 方法 系统
【权利要求书】:

1.一种融合多模式的标签体系构建方法,其特征在于,包括:

S100.基于业务需求确定目标标签,分析和确定目标标签的计算方式和标签目录层级;

S200.根据确定的不同目标标签计算方式,编写计算任务逻辑;

S300.根据确定的不同目标标签计算方式,激活标签计算任务;

S100中,目标标签的计算方式包括SQL方式、模型方式和自定义方式三种;S200中,当目标标签的计算方式为模型方式时,模型方式分为标签概率模型、标签积分模型和标签组合模型,上述模型是基于已有的标签生成新的标签;当模型方式为标签概率模型时,具体方法为:选择模型正样本,并随机按一定比例抽取负样本,共同组成建模样本;再将建模样本划分为训练集和测试集,以标签特征值作为模型输入,然后利用LightGBM算法进行模型训练,分别计算模型在训练集、测试集上的准确率、精确率、召回率,进行模型评价;模型训练好后,数据对象的标签特征值,即可得到其研判概率,最后对概率划分阈值,超过阈值的对象打上标签,此标签为数值型标签;当模型方式为标签积分模型时,具体方法为:首先配置标签积分规则,然后基于ElasticSearch进行积分加权求和计算,最后对积分划分阈值,超过阈值的对象打上标签,此标签为数值型标签;当模型方式为标签组合模型时,具体方法为:首先配置标签交、并、补计算逻辑,筛选出对象群体,然后其打上新的标签,此标签为类别型标签。

2.如权利要求1的一种融合多模式的标签体系构建方法,其特征在于,S100中,标签目录层级采用四层架构,即标签对象、一级分类、二级分类、标签。

3.如权利要求1的一种融合多模式的标签体系构建方法,其特征在于,S200中,当目标标签的计算方式为SQL方式时,具体方法为:根据目标标签反向分析所需的数据资源,将数据资源存储在Hive大数据资源池,标签结果存储在ElasticSearch上,通过编写SQL逻辑代码,组建增量打标任务工作流,实现标签计算。

4.如权利要求1的一种融合多模式的标签体系构建方法,其特征在于,当目标标签的计算方式为自定义方式时,具体方法为:输入对象唯一主键,对其打上自定义标签,此类标签为类别型标签。

5.一种融合多模式的标签体系构建系统,其特征在于,包括:标签目录模块、标签新建模块、任务配置模块、任务调度模块、任务监控模块;其中:

标签目录模块:用于自定义配置标签层级目录树,目录树分为一级分类、二级分类、三级分类;

标签新建模块:用于标签元数据编辑和存储,填写标签基本信息,包括标签名称、标签层级、标签说明、标签同义词,可以一次添加多组标签;

任务配置模块:用于配置标签计算任务逻辑;对于SQL方式,需要配置任务描述、特征类别、特征名称、映射规则、更新方式、更新周期、增量SQL;对于模型方式:需要填写任务描述、模型类别、选择模型、特征类别、特征名称、更新周期;其中标签概率模型还需设定概率阈值范围,积分模型需设定积分阈值范围;对于自定义方式,需要填写任务描述、特征类别、特征名称;

任务调度模块:用于激活标签计算任务,实现定时调度;对于SQL方式和模型方式的标签计算任务,设置标签任务的有效期,激活后基于定时器进行任务调度;对于自定义方式,激活直接上传对象文件,一次性完成打标;

任务监控模块:用于监控标签调度任务的执行状态,只对SQL方式和模型方式的任务进行监控;异常任务分为跑批异常和增量异常;跑批异常是检测任务批次的执行状态,若任务执行失败,则进行预警,并返回失败原因;增量异常是检测标签批次前后的数据量变化,若当前批次标签增量为0,则进行预警。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉烽火众智数字技术有限责任公司,未经武汉烽火众智数字技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110394477.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top