[发明专利]生成网页的方法和装置在审
申请号: | 201611168916.3 | 申请日: | 2016-12-16 |
公开(公告)号: | CN108205532A | 公开(公告)日: | 2018-06-26 |
发明(设计)人: | 秦首科;陈志扬;张泽明;韩聪;姚欣洪;慎涵;王楠 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标信息 内容单元 浏览 方法和装置 集合 网页 相关度 新网页 抓取 内容项集合 获取信息 顺序生成 网页内容 信息呈现 页面内容 重新生成 申请 | ||
本申请公开了一种生成网页的方法和装置。该方法的一具体实施方式包括:获取用户的浏览目标信息;对根据上述浏览目标信息所抓取的网页的页面内容进行识别,以得到至少一个内容单元集合,其中,每个上述内容项集合包括至少一个内容单元;计算上述浏览目标信息与各个内容单元集合所包含的内容的第一相关度;基于上述内容单元集合,按照上述第一相关度由高到低的排列顺序生成新网页。该实施方式可以根据用户的浏览目标信息重新生成新网页,使网页内容具有针对性,可以有效缩短用户获取信息的路径,从而提高信息呈现效率。
技术领域
本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及生成网页的方法和装置。
背景技术
用户通过互联网在终端浏览信息时,往往通过后台服务器从相应站点获取页面并发送至终端以展示给用户。目前的通用站点,大多具有固定的结构,例如包括一个导航页,导航页上包括多个网站导航,每个导航链接到不同的页面,且页面通常是静态的。例如,根据用户输入的搜索词后呈现出导航页后,还需要用户从导航页多次点击才能找到所需内容。因此,由于网页内容较固定,导致用户获取信息的路径较长,从而存在信息呈现效率较低的问题。
发明内容
本申请的目的在于提出一种改进的生成网页的方法和装置,来解决以上背景技术部分提到的技术问题。
一方面,本申请提供了一种生成网页的方法,该方法包括:获取用户的浏览目标信息;对根据上述浏览目标信息所抓取的网页的页面内容进行识别,以得到至少一个内容单元集合,其中,每个上述内容项集合包括至少一个内容单元;计算上述浏览目标信息与各个内容单元集合所包含的内容的第一相关度;基于上述内容单元集合,按照上述第一相关度由高到低的排列顺序生成新网页。
在一些实施例中,上述获取用户的浏览目标信息包括:获取用户的个性化信息,上述个性化信息包括以下至少一种:历史搜索记录、当前的搜索关键词、历史浏览记录、年龄、性别、职业;根据上述个性化信息生成上述浏览目标信息。
在一些实施例中,上述计算上述浏览目标信息与各个内容单元集合所包含的内容的第一相关度包括:对各个内容单元集合提取集合关键词;将上述浏览目标信息与各个内容单元集合的上述集合关键词进行匹配;根据匹配结果确定各个上述第一相关度。
在一些实施例中,上述方法还包括:针对每个内容单元集合,计算上述浏览目标信息与该内容单元集合中的各个内容单元的第二相关度;将该内容单元集合内的内容单元,按照上述第二相关度由高到低进行排列。
在一些实施例中,上述计算上述浏览目标信息与该内容单元集合中的各个内容单元的第二相关度包括:提取各个内容单元的单元关键词;将上述浏览目标信息与上述单元关键词进行匹配;根据匹配结果确定上述浏览目标信息与各个内容单元的第二相关度。
在一些实施例中,所生成的新网页包括:用于显示上述内容单元集合的第一页面和用于显示每个内容单元集合中的内容单元的第二页面。
在一些实施例中,所生成的新网页还包括:用于显示上述第二页面中各内容单元的内容详情的第三页面。
在一些实施例中,上述页面内容包括以下至少一种:页面中的导航结构、导航标签、上述导航标签所链接页面的页面内容。
第二方面,本申请提供了一种生成网页的装置,该装置包括:获取模块,配置用于获取用户的浏览目标信息;识别模块,配置用于对根据上述浏览目标信息所抓取的网页的页面内容进行识别,以得到至少一个内容单元集合,其中,每个上述内容项集合包括至少一个内容单元;第一计算模块,配置用于计算上述浏览目标信息与各个内容单元集合所包含的内容的第一相关度;生成模块,配置用于基于上述内容单元集合,按照上述第一相关度由高到低的排列顺序生成新网页。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611168916.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据抽取方法和数据抽取系统
- 下一篇:一种基于用户协同的歌曲推荐方法和系统