[发明专利]数据处理方法和设备在审
申请号: | 202211196055.5 | 申请日: | 2022-09-27 |
公开(公告)号: | CN115495990A | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 李兴 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62;G06F119/02 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 郭李君;臧建明 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 设备 | ||
本申请提供一种数据处理方法和设备,包括获取测试数据,其中,测试数据包括第一类型测试数据和数值型测试数据;使用第一数据处理模型对第一类型测试数据进行处理,获得布尔型预测结果;以及使用第二数据处理模型对数值型测试数据进行处理,获得数值型预测结果;对布尔型预测结果和数值型预测结果进行融合,获得融合结果,通过如此设置,提升数据处理精度。
技术领域
本申请涉及但不限定于一种数据处理方法和设备。
背景技术
近年来,随着大数据等新技术的快速发展,大数据分析广泛应用于生产数据分析,让生产规划的制定过程更加理性化,实现生产资源优化分配。
现阶段,在对生产数据进行分析过程中,通常使用神经网络模型。神经网络模型实际上是根据训练样本创造出一个多维输入、多维输出的函数,并使用该函数进行处理,网络的训练过程即为调节该函数参数提高处理精度的过程。
但这种处理方法仅能处理数值型信息,无法处理相关字符型信息,这就导致在优化模型的训练前遗失很多重要的特征,难以有效地提高处理的精度和有效率,而且需要较长的训练时间和较大的运算量,不便于实际应用。
发明内容
本申请一实施例提供一种数据处理方法,包括:
获取测试数据,其中,测试数据包括第一类型测试数据和数值型测试数据,第一类型测试数据包括布尔型测试数据和/或字符串测试数据;
使用第一数据处理模型对第一类型测试数据进行处理,获得布尔型预测结果;以及使用第二数据处理模型对数值型测试数据进行处理,获得数值型预测结果;
对布尔型预测结果和数值型预测结果进行融合,获得融合结果。
在一些实施例中,对布尔型预测结果和数值型预测结果进行融合,获得融合结果,具体包括:
对数值型预测结果进行二值化处理,获得二值化预测结果;
使用预设融合规则二值化预测结果、布尔型预测结果以及数值型预测结果进行融合,获得融合结果。
在一些实施例中,对数值型预测结果进行二值化处理获得二值化预测结果,具体包括:
当数值型预测结果大于第一阈值时,获得的二值化预测结果为第一数值;
当数值型预测结果小于或等于第一阈值时,获得的二值化预测结果为第二数值;其中,第一数值表征是,第二数值表征否;
相应地,融合结果包括布尔型融合结果和数值型融合结果,
使用预设融合规则二值化预测结果、布尔型预测结果以及数值型预测结果进行融合,获得融合结果,具体包括以下任意一项:
当二值化预测结果为第二数值时,将布尔型融合结果设置为第二数值,将数值型融合结果设置为最小值;
当二值化预测结果和布尔型预测结果均为第一数值时,将布尔型融合结果设置为第一数值,设置数值型融合结果的数值为数值型预测结果的数值;
当数值型预测结果大于或等于第二阈值时,将布尔型融合结果设为第一数值,将数值型融合结果的数值设置为数值型预测结果的数值;
当数值型预测结果小于第二阈值时,将布尔型融合结果设置为第二数值,将数值型融合结果设置为最小值。
在一些实施例中,第一数据处理模型为随机森林模型,方法还包括:
获取第一类型训练数据,第一类型训练数据包括布尔型训练数据和/或字符串训练数据;重复执行如下步骤:
从第一类型训练数据中有放回的选择多个训练数据,获得一个第一类型子训练数据;根据第一类型子训练数据生成一颗决策树;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211196055.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高安全性的机械式智能停车库
- 下一篇:一种高效氯氟氰菊酯及其制备方法