[发明专利]一种基于特征多时间态的处理方法、系统、设备及介质在审
申请号: | 202210859043.X | 申请日: | 2022-07-21 |
公开(公告)号: | CN115099418A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 张炜林 | 申请(专利权)人: | 上海二三四五网络科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 上海海钧知识产权代理事务所(特殊普通合伙) 31330 | 代理人: | 许兰;姜波 |
地址: | 200135 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 多时 处理 方法 系统 设备 介质 | ||
本申请公开了一种基于特征多时间态的处理方法、系统、设备及介质,所述处理方法包括:特征处理器中构建一个7天的周级别的时间轮盘,时间轮盘随着时间天数的推移自动旋转,每隔一周为一个完整循环;每个刻度上的时间存储当天特征的形态数据,用于描述特征一天的变化状态;构建特征时,记录各特征之间的距离关系;将各特征之间的距离关系由二维升到三维空间中,特征之间的关系越近关联度越高则越密集,从而判定特征之间的关联关系;获取特征多时间态的特征数据以及关联关系。本申请能够满足在任意时间态下对机器学习中的特征数据进行精准还原,在任意情况下精准地还原特定时间线的特征,同时保留特征的关联关系。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于特征多时间态的处理方法、系统、设备及介质。
背景技术
机器学习中,特征数据的质量很大程度上会影响模型的质量、模型的训练依赖特征,模型推理也会依赖特征。所以,数据以及特征是决定一个模型是否优质的重要组成部分。
现有工业级别的特征,主要解决当下时间和场景的特征形态,海量的特征状态只保留最新的特征,这会导致特征随着时间推移,其形态不断发生变化从而降低模型算法的不确定性。
如何解决机器学习中的特征在任意时间进行旅行,在时间的演进下,可灵活穿梭回任意的时间节点还原特征,是本领域技术人员亟待解决的问题。
发明内容
本发明的目的在于提供一种基于特征多时间态的处理方法,以解决上述技术背景中提出的问题。
为实现上述目的,本发明采用以下技术方案:
本申请第一个方面提供了一种基于特征多时间态的处理方法,包括:
S1,特征处理器中构建一个7天的周级别的时间轮盘,时间轮盘随着时间天数的推移自动旋转,每隔一周为一个完整循环;所述时间轮盘包括一个首尾相连的环形数据结构缓冲循环队列,环形数据结构缓冲循环队列分为若干单元槽,每个单元槽对应一个时间刻度;
S2,每个刻度上的时间存储当天特征的形态数据,用于描述特征一天的变化状态;
S3,构建特征时,记录各特征之间的距离关系;
S4,将各特征之间的距离关系由二维升到三维空间中,特征之间的关系越近关联度越高则越密集,从而判定特征之间的关联关系;
S5,获取特征多时间态的特征数据以及关联关系,包括如下步骤:
S51,选定一个特征的空间坐标,通过距离公式计算出与选定特征的空间坐标距离相似的特征,得到选定特征的关联特征集合;
S52,选择一个特征的时间坐标,通过时间度为O(n)的过滤器算法对选定特征的关联特征集合进行过滤,获得目标特征集合。
优选地,所述时间轮盘中,定义时间轮盘中的顺时针方向为队尾至队首方向,逆时针方向为队首至队尾方向。
优选地,所述步骤S2中,每个刻度上的时间存储当天特征的形态数据,以链表的形式进行存储,通过先进先出置换算法定时对当天特征的形态数据进行更新。
本申请第二个方面提供了本申请第一个方面提供了一种基于特征多时间态的处理系统,包括:
时间轮盘构建模块,通过特征处理器中构建一个7天的周级别的时间轮盘,时间轮盘随着时间天数的推移自动旋转,每隔一周为一个完整循环;所述时间轮盘包括一个首尾相连的环形数据结构缓冲循环队列,环形数据结构缓冲循环队列分为若干单元槽,每个单元槽对应一个时间刻度;
刻度存储模块,用于在每个刻度上的时间存储当天特征的形态数据,描述特征一天的变化状态;
特征距离记录模块,用于构建特征时,记录各特征之间的距离关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海二三四五网络科技有限公司,未经上海二三四五网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210859043.X/2.html,转载请声明来源钻瓜专利网。