[发明专利]一种呈现浏览器主体内容的方法有效
申请号: | 201610028516.6 | 申请日: | 2016-01-15 |
公开(公告)号: | CN105718522B | 公开(公告)日: | 2020-02-18 |
发明(设计)人: | 陈明杰 | 申请(专利权)人: | 北京傲游天下科技有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 于国富 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 呈现 浏览器 主体 内容 方法 | ||
1.一种呈现浏览器主体内容的方法,其特征在于,该方法包括:
S1,分析加载成功的页面,判断页面中是否存在表示页面内容的候选节点;如果是,则进入S2;如果否,则仍保持当前界面的阅读状态;
S2,获取候选节点的评分,选择评分最高的候选节点A作为所述页面的主要内容,然后,根据所述候选节点A中的文本、图片和视频的占比,选择相应的阅读模式;
S3,获取所述页面的主要内容标题;
S4,将所述主要内容标题和所述页面的主要内容进行全屏展示;
所述步骤S3,具体按照下述步骤实现:
获取距离所述候选节点外边框预设像素内的标题节点;
计算所述标题节点中的标题文本在所述页面的标题中出现的频率;
将出现频率最高的标题文本作为所述阅读模式的标题;
所述表示页面内容的候选节点按照下述步骤获取:
A1,提取表示主要内容的标签节点;所述标签节点包括:BODY、DIV、TD、P、PRE、D、SPAN、STRONG和ARTICLE;
A2,删除父级元素节点内容为菜单、标题和页脚的节点,然后再删除宽及高小于宽及高阈值的节点,得到一级备用节点组;
A3,通过一级备用节点组中任意一个节点所包含的文本数量W和其标志性属性的权重值,获得该节点的初始评分;
A4,按照初始评分从高到低将一级备用节点排序,得到二级备用节点组;
A5,判断二级备用节点组任意一个节点中Unicode编码字符是否是中文、日文或韩文,如果是,则将该节点的初始评分乘以3,得到该节点评分;如果否,则将该节点的初始评分直接作为本轮计算的该节点评分;然后删除节点评分小于节点评分阈值的节点,得到三级备用节点组;
A6,计算三级备用节点中每个节点的面积,然后删除节点面积小于面积阈值的节点,得到四级备用节点组;
A7,将每个节点中文本的文字字体大小与预先设定的字体大小对比,得到相应的字体权重值C,将四级备用节点组每个节点的节点评分乘以字体权重值C作为该节点的最终评分;
然后删除最终评分小于最终评分阈值的节点,得到五级备用节点组;
A8,从五级备用节点组中去除水平线和/或标题占比大于占比阈值的节点,得到候选节点。
2.根据权利要求1所述方法,其特征在于,步骤A3具体按照下述步骤实现:
获取一级备用节点组中任意一个节点所包含的文本数量W和其标志性属性;
判断所述标志性属性是加分属性还是减分属性,如果标志性属性Q是加分属性,则将W×α确定为该节点的初始评分;如果标志性属性组合Q是减分属性,则将W×β确定为该节点的初始评分;
所述α是加分权重值,所述β是减分权重值;所述加分属性包括article、entry、post、main和content;所述减分属性包括:foot、header、list、menu、rss、sidebar和sponsor。
3.根据权利要求1所述方法,其特征在于,步骤A6具体按照下述步骤实现:
获取三级备用节点组中任意一个三级备用节点的总面积;
获取所述三级备用节点中包括的非文字区的面积;
将所述三级备用节点的总面积与所述非文字区的面积做差,得到所述三级备用节点的面积。
4.根据权利要求1所述方法,其特征在于,步骤A7,具体按照下述步骤实现:
获取四级备用节点组中任意一个四级备用节点的文本,获得所述文本中字体的平均大小,判断所述字体的平均大小与12磅的大小关系;
如果所述字体的平均大小大于12磅,则所述文本的字体权重值C>1;
如果所述字体的平均大小等于12磅,则所述文本的字体权重值C=1;
如果所述字体的平均大小小于12磅,则所述文本的字体权重值C<1;
将所述三级备用节点组中每个节点的节点评分与该节点的文本的字体权重值做乘,得到该节点的最终评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京傲游天下科技有限公司,未经北京傲游天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610028516.6/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法