[发明专利]一种融合多模式的标签体系构建方法和系统有效
申请号: | 202110394477.2 | 申请日: | 2021-04-13 |
公开(公告)号: | CN113313344B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 李巍 | 申请(专利权)人: | 武汉烽火众智数字技术有限责任公司 |
主分类号: | G06Q10/0631 | 分类号: | G06Q10/0631;G06F18/214;G06F18/24 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 吴静 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 模式 标签 体系 构建 方法 系统 | ||
1.一种融合多模式的标签体系构建方法,其特征在于,包括:
S100.基于业务需求确定目标标签,分析和确定目标标签的计算方式和标签目录层级;
S200.根据确定的不同目标标签计算方式,编写计算任务逻辑;
S300.根据确定的不同目标标签计算方式,激活标签计算任务;
S100中,目标标签的计算方式包括SQL方式、模型方式和自定义方式三种;S200中,当目标标签的计算方式为模型方式时,模型方式分为标签概率模型、标签积分模型和标签组合模型,上述模型是基于已有的标签生成新的标签;当模型方式为标签概率模型时,具体方法为:选择模型正样本,并随机按一定比例抽取负样本,共同组成建模样本;再将建模样本划分为训练集和测试集,以标签特征值作为模型输入,然后利用LightGBM算法进行模型训练,分别计算模型在训练集、测试集上的准确率、精确率、召回率,进行模型评价;模型训练好后,数据对象的标签特征值,即可得到其研判概率,最后对概率划分阈值,超过阈值的对象打上标签,此标签为数值型标签;当模型方式为标签积分模型时,具体方法为:首先配置标签积分规则,然后基于ElasticSearch进行积分加权求和计算,最后对积分划分阈值,超过阈值的对象打上标签,此标签为数值型标签;当模型方式为标签组合模型时,具体方法为:首先配置标签交、并、补计算逻辑,筛选出对象群体,然后其打上新的标签,此标签为类别型标签。
2.如权利要求1的一种融合多模式的标签体系构建方法,其特征在于,S100中,标签目录层级采用四层架构,即标签对象、一级分类、二级分类、标签。
3.如权利要求1的一种融合多模式的标签体系构建方法,其特征在于,S200中,当目标标签的计算方式为SQL方式时,具体方法为:根据目标标签反向分析所需的数据资源,将数据资源存储在Hive大数据资源池,标签结果存储在ElasticSearch上,通过编写SQL逻辑代码,组建增量打标任务工作流,实现标签计算。
4.如权利要求1的一种融合多模式的标签体系构建方法,其特征在于,当目标标签的计算方式为自定义方式时,具体方法为:输入对象唯一主键,对其打上自定义标签,此类标签为类别型标签。
5.一种融合多模式的标签体系构建系统,其特征在于,包括:标签目录模块、标签新建模块、任务配置模块、任务调度模块、任务监控模块;其中:
标签目录模块:用于自定义配置标签层级目录树,目录树分为一级分类、二级分类、三级分类;
标签新建模块:用于标签元数据编辑和存储,填写标签基本信息,包括标签名称、标签层级、标签说明、标签同义词,可以一次添加多组标签;
任务配置模块:用于配置标签计算任务逻辑;对于SQL方式,需要配置任务描述、特征类别、特征名称、映射规则、更新方式、更新周期、增量SQL;对于模型方式:需要填写任务描述、模型类别、选择模型、特征类别、特征名称、更新周期;其中标签概率模型还需设定概率阈值范围,积分模型需设定积分阈值范围;对于自定义方式,需要填写任务描述、特征类别、特征名称;
任务调度模块:用于激活标签计算任务,实现定时调度;对于SQL方式和模型方式的标签计算任务,设置标签任务的有效期,激活后基于定时器进行任务调度;对于自定义方式,激活直接上传对象文件,一次性完成打标;
任务监控模块:用于监控标签调度任务的执行状态,只对SQL方式和模型方式的任务进行监控;异常任务分为跑批异常和增量异常;跑批异常是检测任务批次的执行状态,若任务执行失败,则进行预警,并返回失败原因;增量异常是检测标签批次前后的数据量变化,若当前批次标签增量为0,则进行预警。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉烽火众智数字技术有限责任公司,未经武汉烽火众智数字技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110394477.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理