[发明专利]基于模型的预测数据变化频率的方法、装置和计算机设备在审

专利信息
申请号: 202010734520.0 申请日: 2020-07-27
公开(公告)号: CN111859238A 公开(公告)日: 2020-10-30
发明(设计)人: 张圣 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F16/958 分类号: G06F16/958;G06F16/9535;G06F16/9538;G06N20/00
代理公司: 深圳市明日今典知识产权代理事务所(普通合伙) 44343 代理人: 王杰辉
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 模型 预测 数据 变化 频率 方法 装置 计算机 设备
【权利要求书】:

1.一种基于模型的预测数据变化频率的方法,其特征在于,包括:

从百科网站中获取与指定实体对应的指定词条页面内的初始数据,其中,所述指定实体为预设知识库中的任意一个实体;

从所述初始数据中提取出与所述指定实体对应的指定特征数据;

调用预先训练好的预测模型,其中,所述预测模型基于预先收集的样本标签数据集对预设的回归模型进行训练后生成;

将所述指定特征数据输入至所述预测模型内,以通过所述预测模型对所述指定特征数据进行预测处理;

获取所述预设模型输出的与所述指定词条页面对应的输出结果;

将所述输出结果作为所述指定实体的变化频率预测值。

2.根据权利要求1所述的基于模型的预测数据变化频率的方法,其特征在于,所述从所述初始数据中提取出与所述指定实体对应的指定特征数据的步骤,包括:

获取预设的特征类别信息;

根据所述特征类别信息,从所述初始数据中提取出与所述特征类型信息对应的指定特征数据。

3.根据权利要求1所述的基于模型的预测数据变化频率的方法,其特征在于,所述调用预先训练好的预测模型的步骤之前,包括:

从百科网站中收集第一指定数量的词条页面信息;

按照预设的特征构造规则,使用所述词条页面信息构建样本标签数据集,其中,所述样本标签数据集包括与实体相关的特征数据,以及与实体对应的变化频率标签值;

将所述样本标签数据集划分为训练数据集与测试数据集;

利用所述训练数据集,并采用随机梯度下降法对预设的回归模型进行训练,生成训练好的第一初始模型;

采用所述测试数据集对所述训练好的第一初始模型进行验证,并判断是否验证通过;

若验证通过,则将所述训练好的第一初始模型作为所述预测模型;

将所述预测模型存储至区块链网络。

4.根据权利要求3所述的基于模型的预测数据变化频率的方法,其特征在于,所述采用所述测试数据集对所述训练好的第一初始模型进行验证,并判断是否验证通过的步骤,包括:

将所述测试数据集中的各测试样本输入至所述训练好的第一初始模型内,以得到所述各测试样本的测试结果;

根据所述各测试样本的测试结果,获取所述训练好的第一初始模型的准确率;

判断所述准确率是否大于预设的准确率阈值;

若判断出所述准确率大于预设的准确率阈值,则判定验证通过;

若判断出所述准确率不大于预设的准确率阈值,则判定验证不通过。

5.根据权利要求4所述的基于模型的预测数据变化频率的方法,其特征在于,所述判断所述准确率是否大于预设的准确率阈值的步骤之后,包括:

若判断出所述准确率不大于预设的准确率阈值,筛选出所述测试样本集中测试结果错误的指定测试样本;

将所述指定测试样本加入所述训练样本集,生成更新后的训练样本集;

根据所述更新后的训练样本集对所述回归模型进行训练,生成训练好的第二初始模型;

将所述训练好的第二初始模型作为所述预测模型。

6.根据权利要求1所述的基于模型的预测数据变化频率的方法,其特征在于,所述调用预先训练好的预测模型的步骤之前,包括:

获取预先训练好的第二指定数量的子学习器;

根据预设的集成学习算法,使用所有所述子学习器对预设的元模型进行训练,生成训练好的元模型;

将所述训练好的元模型作为所述预测模型。

7.根据权利要求1所述的基于模型的预测数据变化频率的方法,其特征在于,所述从百科网站中获取与指定实体对应的指定词条页面内的初始数据的步骤,包括;

调用与所述百科网站对应的数据查询接口;

通过所述数据查询接口获取与所述指定实体对应的指定词条页面内的初始数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010734520.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top