[发明专利]一种呈现浏览器主体内容的方法有效

专利信息
申请号: 201610028516.6 申请日: 2016-01-15
公开(公告)号: CN105718522B 公开(公告)日: 2020-02-18
发明(设计)人: 陈明杰 申请(专利权)人: 北京傲游天下科技有限公司
主分类号: G06F16/34 分类号: G06F16/34
代理公司: 北京市盛峰律师事务所 11337 代理人: 于国富
地址: 100080 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 呈现 浏览器 主体 内容 方法
【权利要求书】:

1.一种呈现浏览器主体内容的方法,其特征在于,该方法包括:

S1,分析加载成功的页面,判断页面中是否存在表示页面内容的候选节点;如果是,则进入S2;如果否,则仍保持当前界面的阅读状态;

S2,获取候选节点的评分,选择评分最高的候选节点A作为所述页面的主要内容,然后,根据所述候选节点A中的文本、图片和视频的占比,选择相应的阅读模式;

S3,获取所述页面的主要内容标题;

S4,将所述主要内容标题和所述页面的主要内容进行全屏展示;

所述步骤S3,具体按照下述步骤实现:

获取距离所述候选节点外边框预设像素内的标题节点;

计算所述标题节点中的标题文本在所述页面的标题中出现的频率;

将出现频率最高的标题文本作为所述阅读模式的标题;

所述表示页面内容的候选节点按照下述步骤获取:

A1,提取表示主要内容的标签节点;所述标签节点包括:BODY、DIV、TD、P、PRE、D、SPAN、STRONG和ARTICLE;

A2,删除父级元素节点内容为菜单、标题和页脚的节点,然后再删除宽及高小于宽及高阈值的节点,得到一级备用节点组;

A3,通过一级备用节点组中任意一个节点所包含的文本数量W和其标志性属性的权重值,获得该节点的初始评分;

A4,按照初始评分从高到低将一级备用节点排序,得到二级备用节点组;

A5,判断二级备用节点组任意一个节点中Unicode编码字符是否是中文、日文或韩文,如果是,则将该节点的初始评分乘以3,得到该节点评分;如果否,则将该节点的初始评分直接作为本轮计算的该节点评分;然后删除节点评分小于节点评分阈值的节点,得到三级备用节点组;

A6,计算三级备用节点中每个节点的面积,然后删除节点面积小于面积阈值的节点,得到四级备用节点组;

A7,将每个节点中文本的文字字体大小与预先设定的字体大小对比,得到相应的字体权重值C,将四级备用节点组每个节点的节点评分乘以字体权重值C作为该节点的最终评分;

然后删除最终评分小于最终评分阈值的节点,得到五级备用节点组;

A8,从五级备用节点组中去除水平线和/或标题占比大于占比阈值的节点,得到候选节点。

2.根据权利要求1所述方法,其特征在于,步骤A3具体按照下述步骤实现:

获取一级备用节点组中任意一个节点所包含的文本数量W和其标志性属性;

判断所述标志性属性是加分属性还是减分属性,如果标志性属性Q是加分属性,则将W×α确定为该节点的初始评分;如果标志性属性组合Q是减分属性,则将W×β确定为该节点的初始评分;

所述α是加分权重值,所述β是减分权重值;所述加分属性包括article、entry、post、main和content;所述减分属性包括:foot、header、list、menu、rss、sidebar和sponsor。

3.根据权利要求1所述方法,其特征在于,步骤A6具体按照下述步骤实现:

获取三级备用节点组中任意一个三级备用节点的总面积;

获取所述三级备用节点中包括的非文字区的面积;

将所述三级备用节点的总面积与所述非文字区的面积做差,得到所述三级备用节点的面积。

4.根据权利要求1所述方法,其特征在于,步骤A7,具体按照下述步骤实现:

获取四级备用节点组中任意一个四级备用节点的文本,获得所述文本中字体的平均大小,判断所述字体的平均大小与12磅的大小关系;

如果所述字体的平均大小大于12磅,则所述文本的字体权重值C>1;

如果所述字体的平均大小等于12磅,则所述文本的字体权重值C=1;

如果所述字体的平均大小小于12磅,则所述文本的字体权重值C<1;

将所述三级备用节点组中每个节点的节点评分与该节点的文本的字体权重值做乘,得到该节点的最终评分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京傲游天下科技有限公司,未经北京傲游天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610028516.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top