[发明专利]一种多样式数据的标准化处理方法在审
申请号: | 201811063421.3 | 申请日: | 2018-09-12 |
公开(公告)号: | CN109359145A | 公开(公告)日: | 2019-02-19 |
发明(设计)人: | 郑锐韬;李勇波;涂旭平;季统凯 | 申请(专利权)人: | 国云科技股份有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 广东莞信律师事务所 44332 | 代理人: | 陈熙 |
地址: | 523808 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及大数据技术领域,尤其是一种支持多样式数据输入并可选择多种算法进行数据标准化的方法。本发明方法所述的方法是对多种不同的数据源在进行数据分析时的数据输入特征进行提取分析,对各类数据源在数据分析前进行数据标准化处理,提高数据的迭代速度、收敛速度,去除数据的单位限制,将不同的数据转化为无量纲的纯数值,统一数据间的量级,便于不同单位或量级的指标能够进行比较和加权;通过min‑max标准化、log函数转换、atan函数转换、z‑score标准化等算法把数据标准地映射到【0,1】区间上;规范分析的数据区间。本方法通过组件化的方式,使多样式的数据能快速地实现数据的标准化,提供了一种数据准确快速转换的方法。 | ||
搜索关键词: | 数据标准化 函数转换 数据分析 样式数据 标准化 数据源 算法 标准化处理 快速转换 数据标准 数据区间 数据转化 大数据 无量纲 组件化 映射 迭代 去除 加权 收敛 分析 样式 统一 | ||
【主权项】:
1.一种多样式数据处理中高效进行标准化的方法,其特征在于:所述的方法是对多种不同的数据源在进行数据分析时的数据输入特征进行提取分析,对各类数据源在数据分析前进行数据标准化处理,提高数据的迭代速度、收敛速度,去除数据的单位限制,将不同的数据转化为无量纲的纯数值,统一数据间的量级,便于不同单位或量级的指标能够进行比较和加权;通过min‑max标准化、log函数转换、atan函数转换、z‑score标准化等算法把数据标准地映射到【0,1】区间上;规范分析的数据区间。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811063421.3/,转载请声明来源钻瓜专利网。