[发明专利]基于模型的预测数据变化频率的方法、装置和计算机设备在审
申请号: | 202010734520.0 | 申请日: | 2020-07-27 |
公开(公告)号: | CN111859238A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 张圣 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/9535;G06F16/9538;G06N20/00 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模型 预测 数据 变化 频率 方法 装置 计算机 设备 | ||
1.一种基于模型的预测数据变化频率的方法,其特征在于,包括:
从百科网站中获取与指定实体对应的指定词条页面内的初始数据,其中,所述指定实体为预设知识库中的任意一个实体;
从所述初始数据中提取出与所述指定实体对应的指定特征数据;
调用预先训练好的预测模型,其中,所述预测模型基于预先收集的样本标签数据集对预设的回归模型进行训练后生成;
将所述指定特征数据输入至所述预测模型内,以通过所述预测模型对所述指定特征数据进行预测处理;
获取所述预设模型输出的与所述指定词条页面对应的输出结果;
将所述输出结果作为所述指定实体的变化频率预测值。
2.根据权利要求1所述的基于模型的预测数据变化频率的方法,其特征在于,所述从所述初始数据中提取出与所述指定实体对应的指定特征数据的步骤,包括:
获取预设的特征类别信息;
根据所述特征类别信息,从所述初始数据中提取出与所述特征类型信息对应的指定特征数据。
3.根据权利要求1所述的基于模型的预测数据变化频率的方法,其特征在于,所述调用预先训练好的预测模型的步骤之前,包括:
从百科网站中收集第一指定数量的词条页面信息;
按照预设的特征构造规则,使用所述词条页面信息构建样本标签数据集,其中,所述样本标签数据集包括与实体相关的特征数据,以及与实体对应的变化频率标签值;
将所述样本标签数据集划分为训练数据集与测试数据集;
利用所述训练数据集,并采用随机梯度下降法对预设的回归模型进行训练,生成训练好的第一初始模型;
采用所述测试数据集对所述训练好的第一初始模型进行验证,并判断是否验证通过;
若验证通过,则将所述训练好的第一初始模型作为所述预测模型;
将所述预测模型存储至区块链网络。
4.根据权利要求3所述的基于模型的预测数据变化频率的方法,其特征在于,所述采用所述测试数据集对所述训练好的第一初始模型进行验证,并判断是否验证通过的步骤,包括:
将所述测试数据集中的各测试样本输入至所述训练好的第一初始模型内,以得到所述各测试样本的测试结果;
根据所述各测试样本的测试结果,获取所述训练好的第一初始模型的准确率;
判断所述准确率是否大于预设的准确率阈值;
若判断出所述准确率大于预设的准确率阈值,则判定验证通过;
若判断出所述准确率不大于预设的准确率阈值,则判定验证不通过。
5.根据权利要求4所述的基于模型的预测数据变化频率的方法,其特征在于,所述判断所述准确率是否大于预设的准确率阈值的步骤之后,包括:
若判断出所述准确率不大于预设的准确率阈值,筛选出所述测试样本集中测试结果错误的指定测试样本;
将所述指定测试样本加入所述训练样本集,生成更新后的训练样本集;
根据所述更新后的训练样本集对所述回归模型进行训练,生成训练好的第二初始模型;
将所述训练好的第二初始模型作为所述预测模型。
6.根据权利要求1所述的基于模型的预测数据变化频率的方法,其特征在于,所述调用预先训练好的预测模型的步骤之前,包括:
获取预先训练好的第二指定数量的子学习器;
根据预设的集成学习算法,使用所有所述子学习器对预设的元模型进行训练,生成训练好的元模型;
将所述训练好的元模型作为所述预测模型。
7.根据权利要求1所述的基于模型的预测数据变化频率的方法,其特征在于,所述从百科网站中获取与指定实体对应的指定词条页面内的初始数据的步骤,包括;
调用与所述百科网站对应的数据查询接口;
通过所述数据查询接口获取与所述指定实体对应的指定词条页面内的初始数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010734520.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置