[发明专利]一种确定页面可读性的方法和服务器无效
申请号: | 201210104882.7 | 申请日: | 2012-04-11 |
公开(公告)号: | CN103365935A | 公开(公告)日: | 2013-10-23 |
发明(设计)人: | 朱靖君;林世飞 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/22 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 黄厚刚 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 页面 可读性 方法 服务器 | ||
技术领域
本发明涉及计算机技术领域,特别涉及一种确定页面可读性的方法和服务器。
背景技术
随着无线互联网技术和移动终端的发展,越来越多的人开始使用移动终端浏览网页。移动终端浏览器展示的是wap(Wireless Application Protocol,为无线应用协议)页面,它不同于在电脑浏览器中看到的web页面,一般的wap页面较小且较简单。Wap页面在制作时有些是直接从web页面修改而来的,在修改的时候很容易忽视了wap页面的特性,造成修改的页面不符合wap页面的规范,影响wap页面的可读性。因此需要一套评估wap页面可读性的方法,以便搜索引擎根据该评估对各wap页面进行排序,使得用户优先看到可读性好的页面。
现有技术中对评估wap页面的可读性,一般是通过几方面进行的:一、对页面中的背景颜色和文字颜色进行对比,评估该页面的可读性,减少阅读疲劳;二、对页面中文字的密度,文字的大小以及文字的字体进行判断,评估该页面的可读性。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
现有技术对wap页面可读性的评估会受评估者主观设定的评估因素影响,仅代表部分用户的体验,并不能客观的评估出wap页面可读性。因此根据该方法得到的确定页面可读性的结论,并不能全面综合的评估wap页面的可读性,由此得到的搜索引擎wap页面的排序对提升用户的体验效果差。
发明内容
为了提高评估wap页面可读性的客观性,且根据该评估结论用于搜索引擎对wap页面的排序,可以提高用户的体验。本发明实施例提供了一种确定页面可读性的方法和服务器。所述技术方案如下:
本发明实施例提出了一种确定页面可读性的方法,包括:
获取无线应用协议wap页面的页面信息;
在所述wap页面中获取影响所述wap页面可读性的特征项信息;
根据所述wap页面的页面信息和所述特征项信息,确定所述wap页面的可读性。
作为上述技术方案的优选,所述获取无线应用协议wap页面的页面信息,具体包括:
获取所述wap页面中的文本内容和所述文本内容的总字节数;
提取所述wap页面中的换行标识,根据所述换行标识确定所述wap页面的总段落数以及每段落的字节数;
将所述wap页面中的文本内容、所述文本内容的总字节数、所述wap页面的总段落数以及每段落的字节数作为所述wap页面的页面信息。
作为上述技术方案的优选,所述在所述wap页面中获取影响所述wap页面可读性的特征项信息,具体包括:
根据所述wap页面中的文本内容,获取所述wap页面中的所述终极电子布告栏UBB代码;
根据所述wap页面中的文本内容,获取所述wap页面中的所述客户端脚本语言JavaScript代码和层叠样式表Css代码;
根据所述wap页面中的每段落的字节数,获取所述wap页面中的所述字节数超过预设阈值的段落;
根据所述wap页面中的文本内容,获取所述wap页面中的所述不可用统一资源定位符URL链接;
根据所述wap页面中的文本内容,获取所述wap页面中的所述乱码字符;
将所述UBB代码、所述JavaScript代码和Css代码、所述字节数超过预设阈值的段落、所述不可用URL链接、所述乱码字符作为特征项信息。
作为上述技术方案的优选,所述根据所述wap页面的页面信息和所述特征项信息,确定所述wap页面的可读性,具体包括:
根据所述wap页面的文本内容的总字节数和所述UBB代码的字节数,确定所述UBB代码的可读性;
根据所述wap页面的文本内容的总字节数和所述JavaScript和Css代码的字节数,确定所述JavaScript和Css代码的可读性;
根据所述wap页面的总段落数和所述字节数超过预设阈值的段落的数量,确定所述字节数超过预设阈值的段落的可读性;
根据所述wap页面的文本内容的总字节数和所述不可用URL链接的字节数,确定所述不可用URL链接的可读性;
根据所述wap页面的文本内容的总字节数和所述乱码字符的字节数,确定所述乱码字符的可读性;
根据确定得到的至少一种特征项信息的可读性,确定所述wap页面的可读性。
本发明实施例提出了一种确定页面可读性的服务器,包括:
第一获取模块,用于获取无线应用协议wap页面的页面信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210104882.7/2.html,转载请声明来源钻瓜专利网。