[发明专利]获取短URL对应页面标题的方法及装置在审
申请号: | 201110130169.5 | 申请日: | 2011-05-19 |
公开(公告)号: | CN102789460A | 公开(公告)日: | 2012-11-21 |
发明(设计)人: | 范禹;王波;蒋珍;闫清岭;吕旭辉 | 申请(专利权)人: | 腾讯科技(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京派特恩知识产权代理事务所(普通合伙) 11270 | 代理人: | 王黎延;周义刚 |
地址: | 100089 北京市海淀区海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 url 对应 页面 标题 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种获取短统一资源定位符(Uniform/Universal Resource Locator,URL)对应页面标题的方法及装置。
背景技术
随着网络技术的发展,微博在中国发展迅速,用户可以方便的在微博中分享URL地址,但是,由于微博消息限制在140字,而大量URL地址长度达到几十字长,这就限制了用户每条消息可输入内容的长度,不利于用户体验。
现有技术中,微博可以提供自动将长URL转换为短URL的服务,来相应增加用户可输入内容的长度,并且,微博前端页面往往会在用户鼠标指向一个短URL时,弹出一个浮层,提示短URL对应的长URL。
但是,既使能够获取短URL对应的长URL,用户也无法获知该短URL指向什么页面,从而无法判断是否对页面内容感兴趣以及是否要打开该页面,如果打开页面后发现没兴趣而再关闭,会影响用户体验。
发明内容
有鉴于此,本发明的主要目的在于提供一种获取短URL对应页面标题的方法及装置,能够向用户提示短URL对应页面的标题,提高用户体验。
为达到上述目的,本发明的技术方案是这样实现的:
一种获取短统一资源定位符URL对应页面标题的方法,包括:后台服务模块调用搜索引擎的接口获取短URL对应的页面标题,获取成功,则存储获取的所述短URL对应的页面标题;获取失败,则调用本地服务获取所述短URL对应的页面标题。
所述后台服务模块调用搜索引擎的接口获取短URL对应的页面标题之前,该方法还包括:用户在前端页面生成所述短URL;前端页面通知后台服务模块获取所述短URL对应的页面标题。
所述后台服务模块调用本地服务获取所述短URL对应的页面标题为:后台服务模块调用本地服务抓取短URL对应的页面;抓取到页面后,对抓取的页面进行文本分析,将抓取的页面的编码格式转换为UTF-8编码格式,并分析页面结构,从页面中获取到页面标题。
该方法还包括:后台服务模块调用本地服务获取短URL对应的页面标题失败,则间隔一段时间后,再次获取所述短URL对应的页面标题。
该方法还包括:用户将鼠标指向短URL时,前端页面从后台服务模块获取并显示所述短URL对应的页面标题。
一种获取短URL对应页面标题的装置,包括后台服务模块,用于调用搜索引擎的接口获取短URL对应的页面标题,获取成功,则存储获取的所述短URL对应的页面标题;获取失败,则调用本地服务获取所述短URL对应的页面标题。
该装置还包括前端页面,用于在用户生成短URL后,通知后台服务模块获取所述短URL对应的页面标题。
所述后台服务模块调用本地服务获取短URL对应的页面标题为:后台服务模块调用本地服务抓取短URL对应的页面;抓取到页面后,对抓取的页面进行文本分析,将抓取的页面的编码格式转换为UTF-8编码格式,并分析页面结构,从页面中获取到页面标题。
所述后台服务模块,还用于在调用本地服务获取短URL对应的页面标题失败后,间隔一段时间再获取所述短URL对应的页面标题。
所述前端页面,还用于在用户将鼠标指向短URL时,从后台服务模块获取并显示所述短URL对应的页面标题。
本发明获取短URL对应页面标题的方法及装置,后台服务模块调用搜索引擎的接口获取短URL对应的页面标题,获取成功,则存储获取的所述短URL对应的页面标题;获取失败,则调用本地服务获取所述短URL对应的页面标题。本发明针对微博消息中短URL,通过在后台获取到其对应页面的标题,在前端页面中展现出此标题,从而能够给用户更好的体验。
附图说明
图1为本发明获取短URL对应页面标题的方法流程示意图。
具体实施方式
本发明提出了一种结合搜索引擎和本地页面分析抓取工具相结合的方法来实现短URL页面标题抓取。图1为本发明获取短URL对应页面标题的方法流程示意图,如图1所示,该方法包括:
步骤101:用户在前端页面生成短URL后,前端页面通知后台服务模块获取所述短URL对应的页面标题。
步骤102:后台服务模块调用搜索引擎(如SOSO搜索引擎)的接口获取所述短URL对应的页面标题,获取失败,转到步骤103;获取成功,转到步骤104。
这里,由于搜索引擎收录页面有一定延后,如果后台服务模块调用搜索引擎获取短URL对应的页面标题时,搜索引擎尚未收录该短URL对应的页面,则会导致获取失败。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(北京)有限公司,未经腾讯科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110130169.5/2.html,转载请声明来源钻瓜专利网。