[发明专利]一种海量数据下可靠索引更新系统及方法有效
申请号: | 201510221611.3 | 申请日: | 2015-05-04 |
公开(公告)号: | CN104899249B | 公开(公告)日: | 2018-07-13 |
发明(设计)人: | 朱红松;陈磊;孙利民;于楠;闫兆腾;黄伟武 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种海量数据下可靠索引更新系统,包括日志预写模块、日志数据库、断点控制模块、断点设置模块、资源缓存模块和内存索引存储区;本发明还涉及一种海量数据下可靠索引更新方法;本发明针对索引构建速度和资源数据更新速度不匹配以及宕机时内存索引易丢失的情况,加入了日志预写、断点设置的机制解决了以上问题,保证了索引更新的可靠性;其次,针对物联网实体资源数据动态变化速度快的特点,在传统的实时索引更新方法中的内存索引更新操作之前加入了资源缓存的机制,在10000个资源的属性重复更新100次的情况下将索引更新速度提升了10倍以上。 | ||
搜索关键词: | 索引更新 海量数据 内存索引 断点设置 资源缓存 日志 更新 断点控制模块 日志数据库 更新操作 机制解决 实时索引 实体资源 数据动态 速度提升 索引构建 资源数据 传统的 物联网 写模块 匹配 重复 保证 | ||
【主权项】:
1.一种海量数据下可靠索引更新系统,其特征在于,包括日志预写模块(1)、日志数据库(2)、断点控制模块(3)、断点设置模块(4)、资源缓存模块(5)和内存索引存储区(6);所述日志预写模块(1),用于实时接收从物联网实体资源数据中心(7)推送来的资源更新信息,并将资源更新信息以“资源ID+属性参数”的格式写入日志数据库中;所述日志数据库(2),用于保存各条“资源ID+属性参数”的资源更新记录;所述断点控制模块(3),用于根据所述日志数据库(2)中保存的资源更新记录的增长情况判断是否达到阈值,如果达到阈值,将断点信号发送至所述断点设置模块(4)后,再发送更新信号至所述资源缓存模块(5)进行处理;所述断点设置模块(4),用于记录各组资源更新记录的断点信息,当接收到所述断点信号后,以本组资源更新记录中更新的最后一条资源更新记录作为断点来建立断点信息,并将断点信息写入断点记录表中;所述资源缓存模块(5),用于当接收到更新信号后,在建立的更新记录缓存区或所述内存索引存储区(6)中逐一对本组的资源更新记录的内容进行更新处理;所述资源缓存模块(5)包括表单创建单元(501)和记录处理单元(502)和更新记录缓存区(503);所述表单创建单元(501),用于从所述日志数据库(2)中获取本组“资源ID+属性参数”的资源更新记录,并根据属性参数获取对应的属性内容,并建立<资源ID+属性内容>信息的表单;所述记录处理单元(502),用于逐一判断表单中的资源ID是否已存在于所述更新记录缓存区(503)中,如果存在,则调出原属性内容将其更新为表单中该资源ID对应的属性内容,否则,在所述内存索引存储区(6)中查找,如果存在,则调出原属性内容将其更新为表单中该资源ID对应的属性内容,如果均不存在于两者中,则将该条资源更新记录的资源ID和属性内容保存至所述更新记录缓存区(503)中;所述更新记录缓存区(503),用于存储资源ID和属性内容,并将经过处理后的属性内容进行存储;所述内存索引存储区(6),用于当资源缓存模块(5)处理完成后,将在更新记录缓存区处理的资源更新记录的内容导入,并根据经过更新处理后的资源更新记录的内容对内存索引文件进行更新。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510221611.3/,转载请声明来源钻瓜专利网。