[发明专利]一种实时采集已购电子资源数据库访问记录的方法有效
申请号: | 201911215102.4 | 申请日: | 2019-12-02 |
公开(公告)号: | CN110995835B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 方旭光 | 申请(专利权)人: | 杭州麦达电子有限公司 |
主分类号: | H04L67/565 | 分类号: | H04L67/565;H04L67/02;H04L67/55;H04L9/40 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 陈辉 |
地址: | 310013 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实时 采集 电子 资源 数据库 访问 记录 方法 | ||
本发明公开了一种实时采集已购电子资源数据库访问记录的方法,具体步骤为:1:首先使用终端完成终端认证;2:根据终端身份和需要访问的数据库信息将请求送到数据库网关;3:数据库网关将请求转发到实际的数据库网站;4:在分析规则中定义了不同数据库在终端浏览器显示时其各元素所在位置,有便于脚本文件进行有规则的页面抓取;5:返回的页面在终端浏览器打开后,页面分析脚本自动运行,根据在js脚本中定义好的规则提取页面中所看文章的内容;6:提取完成后,在终端浏览器自动调用日志记录接口,完成日志写入。本发明的特点:实时性高,不受页面加密的影响,终端运算,可以支持大规模终端的使用;(4)适用性高,(5)维护方便。
技术领域
本发明设计一种异构电子资源数据库的终端使用痕迹跟踪技术,通过此技术,可以实现终端在不同的数据库中访问的主要动作可以实时记录,包括浏览详情和下载全文,可以精确到具体所看页面的内容。
背景技术
目前图书馆及研究机构会花费大量的资金用于购买电子资源数据库,由于电子资源数据库厂商较多、资源类型也很多,且都是有厂商直接提供在线的网站提供服务,图书馆或研究机构在使用这些数据库时,为了方便使用,都通过IP验证用户的合法性,无法做到实名,另外每个数据库网站不同,样式不同,无法得知终端实际使用了那些数据库以及那些文献,具体缺陷有:
1:无实名认证,无法获知具体有哪些终端在使用数据库;
2:各数据库结构不同,部分会提供简要的下载日志,单无法得知具体是哪个终端访问了哪篇文章;
3:不同数据库记录格式和标准不同,无法将各数据库的访问情况进行统一汇总管理。
国内外很多公司都在想办法解决这个问题,目前解决的问题有如下几种:网络监听方式
通过在学校的网络出口处添加软硬件设备来监听整个学校的网络访问,从中筛选出相关网站的访问记录;
通过本地搭建的导航系统记录终端访问日志,分析终端访问的数据库;根据数据库厂商给的访问报告进行访问统计。
由于电子资源数据库样式多样,且网站普遍采用内容加密方式,目前相关的日志记录方式普遍存在如下几个问题:
(1)日志获取不实时,通过网络监听的方式,先讲访问信息记录到日志文件,分析工具定时取分析日志文件再提取具体访问日志信息,一般会有几小时的延时;
(2)记录日志噪音多,提取准确信息困难,在日志文件中,会记录所有网络访问信息,包括有效数据和无效数据,需要大量的规则和运算来进行分析;
(3)日志记录的内容不够精细,通过日志分析只能知道访问的网站页面及时间,无法获知访问的具体内容,以为页面内容传输采用HTTPS协议加密,无法获知;
(4)日志分析无法关联终端,不确定是哪个终端的访问;
(5)数据库商提供的日志只包含期刊的下载总量,不包含具体访问文献和访问终端信息。
因此,迫切需要一种可以实时、准确记录终端访问内容的日志记录访问,终端和图书馆可实时掌握所购数据库的具体使用情况。
发明内容
本发明的目的在于提供一种实时采集已购电子资源数据库访问记录的方法。
本发明解决上述技术问题采用的技术方案是:
一种实时采集已购电子资源数据库访问记录的方法,是采用数据库网关转发技术和页面分析技术结合来实现,具体步骤为:
(1):首先使用终端完成终端认证;
(2):根据终端身份和需要访问的数据库信息将请求送到数据库网关;
(3):数据库网关将请求转发到实际的数据库网站;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州麦达电子有限公司,未经杭州麦达电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911215102.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子设备及其音量调节方法
- 下一篇:一种高压线下环境监控警示装置