[发明专利]一种基于时空信息加权的多源数据融合的方法与装置在审
申请号: | 202110682555.9 | 申请日: | 2021-06-18 |
公开(公告)号: | CN113283239A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 董莹莹;孙伟;吴丹;田鹏飞 | 申请(专利权)人: | 亿景智联(北京)科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06F40/18;G06N20/00 |
代理公司: | 南京鼎傲知识产权代理事务所(普通合伙) 32327 | 代理人: | 刘蔼民 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时空 信息 加权 数据 融合 方法 装置 | ||
1.一种基于时空信息加权的多源数据融合的方法,其特征在于:包括如下步骤:
S1、建立基准数据库;
S2、通过多种数据收集渠道,收集到多份增量数据集;
S3、依次将DS1…DS5融合进基准数据库;
S4、复盘数据融合过程,对数据融合算法进行调优。
2.根据权利要求1所述的一种基于时空信息加权的多源数据融合的方法,其特征在于,所述S1中具体步骤为:
S1.1、以省自治区为单位,建立31个基准表,词库表,字典表;
S1.2、设计基准表的表结构;
S1.3、在基准表,词库表,字典表中填充初始数据,包括WGS84坐标系下的POI及地理位置信息。
3.根据权利要求1所述的一种基于时空信息加权的多源数据融合的方法,其特征在于,所述S2中具体步骤为:
S2.1、接收从不同渠道获取到多份增量数据:包括传感器收集、人工录入、开放的数据平台、第三方合作、购买;
S2.2、收集到增量数据集名称分别叫DS1、DS2…DSn;
S2.3、将增量数据进行本地化存储和归档。
4.根据权利要求1所述的一种基于时空信息加权的多源数据融合的方法,其特征在于,所述S3中具体步骤为:
S3.1、对增量数据集分别进行预处理;
S3.2、依次寻找增量数据集中各记录在基准库中的同一记录
S3.3、将增量数据集的数据追加更新进基础数据库。
5.根据权利要求1所述的一种基于时空信息加权的多源数据融合的方法,其特征在于,所述S4具体步骤为:
S4.1、从数据融合日志系统中提取本次数据融合的所有操作日志
S4.1、重放操作日志,更新词库表和字段名称字典表
S4.2.1、根据日志中地址字段的分词信息,按需更新词库表;
S4.2.2、根据日志中其他字段名称,按需更新字段名称字典表;
S4.3、重放操作日志,制作机器学习样本
S4.3.1、采用人工标记的手段,对每条历史对应的融合过程进行打分;
S4.3.2提取每条历史的关键字段和打分数据;
S4.3.3、按照机器学习算法要求,生成本次操作的机器学习样本数据;
S4.4、基于样本数据,采用机器学习算法优化更新加权因子
S4.4.1、采用机器学习算法,基于样本数据进行训练,训练出更优的加权模型;
S4.4.2、将最新的加权模型更新到字典表中;
S4.5、重新执行步骤s4.3。
6.根据权利要求4所述的一种基于时空信息加权的多源数据融合的方法,其特征在于,所述S3.1的具体步骤如下:
S3.1.1、对增量数据集进行清洗,剔除离群数据;
S3.1.2、空间参考系及度量单位的统一;
S3.1.3、关键字段检测;
S3.1.4、补齐关键字段和对应内容:若经纬度字段无值,用地理编码生成WGS84坐标系下的经纬度进行填充;
S3.1.5、基于字典表对增量数据集进行字段映射:介于数据来源的多样性,对同一属性名称的定义不同,如属性“类别”可能被命名为“类型”、“类别”,为了保证数据的可读性及一致性,需要按属性名实指,根据字典映射表对基准库字段与增量数据集字段进行映射;
S3.1.6、向日志系统中追加一条数据预处理日志:其中包含被过虑的记录信息以及过滤的原因、字段补齐信息、空间转换信息、字段映射信息、操作时间等信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亿景智联(北京)科技有限公司,未经亿景智联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110682555.9/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置