[发明专利]面向主题的新内容检索推送方法、装置、设备及存储介质在审
申请号: | 202110041726.X | 申请日: | 2021-01-13 |
公开(公告)号: | CN112765464A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 朱俊杰;陈秋实;王瑜;杨妮;张婷婷;左泽均 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/951;G06F16/955;G06F16/34;G06F16/335 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 主题 内容 检索 推送 方法 装置 设备 存储 介质 | ||
本发明提供了一种面向主题的新内容检索推送方法、装置、设备及存储介质。本发明针对各主题信息有需求的用户,能够准时地向这些用户提供关于给定主题领域的新信息。用户在输入想要跟踪的主题内容后,设置希望获得推送的时间以及接收推送信息的邮箱后,系统会在指定的时间采用爬虫技术对给定主题的信息进行获取,经过数据库比较,将最新的内容推送至用户预留邮箱。此方案可以使用户节省许多搜索的时间以及浪费在信息过滤过程中的时间,使得用户在获取信息时更加便捷灵活。同时本方法除了使用基本的邮件提示外,还提供一种直接采用pdf格式将网页内容推送至用户邮箱的方法,使信息获取更为便捷。
技术领域
本发明涉及主题信息推送技术领域,具体涉及一种面向主题的新内容检索推送方法、装置、设备及存储介质。
背景技术
目前对于主题信息检索推送技术的研究并不多,典型的主要有Google alert,用于随时追踪是否有用户感兴趣的新内容,但是这种技术设置了相关权限,仅限于部分用户使用,对国内用户来说,无法体验到这个功能。此外在数据源上可能与国内的受众并不相匹配,对用户来说,在新内容接收的形式上有所欠缺,未提供PDF文件形式的内容推送,在内容呈现上不够清晰、完整。因此,传统的信息检索推送方法数据源匹配度不高、推送形式单一、内容呈现不佳式亟待解决的技术问题。
发明内容
本发明提供了一种面向主题的新内容检索推送方法,旨在解决传统的信息检索推送方法的数据源匹配度不高、推送形式单一、内容呈现不佳的技术问题。
为了实现上述目的,本发明提供的一种面向主题的新内容检索推送方法,包括以下步骤:
S1、添加用户输入的订阅信息,并将所述订阅信息存入数据库,具体步骤为:
提供系统表单,收集用户输入的感兴趣的主题信息,支持多关键字联合创建主题,收集用户推送频率需求,收集用户邮箱信息,收集用户指定新内容返回形式。根据以上用户输入的订阅信息,在数据库内存储该项记录。
S2、遍历所述订阅信息,并根据遍历到的订阅信息执行对应的订阅任务,获得相关主题内容,具体步骤包括:
后台服务器在获取当前订阅记录后,开启相关服务,包括:
通过对订阅记录的获取,系统进入静默状态直到达到用户预设推送时间,此时,根据遍历到的订阅信息执行对应的订阅任务,系统开始启动新内容获取服务,根据主题及关键字内容,系统采用爬虫技术对相应主题的内容进行获取,根据用户设定的时间频率自动设置主题订阅的时间跨度,最终实现对数据的获取,获得相关主题内容。
S3、将所述相关主题内容与数据库中已有的内容进行比较筛选,获得新内容,具体步骤包括:
在获取相关主题内容后,根据url链接判断获取到的结果唯一性,同一个url链接仅记录为一条内容。将获取得到相关内容,与数据库内已有内容进行对比,判断当前获取的内容是否为新内容,若为新内容,将此记录添加至缓存,直到所有的新查询内容与数据库内数据进行完全对比,筛选出新内容。
S4、根据用户所设置的推送形式,将新内容进行推送至用户端,推送形式包括:
(1)订阅记录直接传递
订阅记录直接传递的格式是,通过邮件,直接将新内容的标题、链接、以及摘要内容进行传递,用户可以通过邮件直接对获取到的内容进行点击访问。
(2)PDF文件形式传递
PDF形式传递则是获取新内容的url链接,并通由程序对这些链接进行访问,将这些链接页面进行下载,形成一份包含全部新内容页面的pdf文件,可以使获取到的结果更加直观、清晰。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110041726.X/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法