[发明专利]视觉网页分析系统与方法有效
申请号: | 201510204481.2 | 申请日: | 2015-04-27 |
公开(公告)号: | CN106156236B | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 李光耀 | 申请(专利权)人: | 李光耀 |
主分类号: | G06F16/957 | 分类号: | G06F16/957;G06K9/00 |
代理公司: | 11021 中科专利商标代理有限责任公司 | 代理人: | 宋焰琴 |
地址: | 美国德州理查森巿*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明有关于一种视觉网页分析系统,包括一影像分析单元、一区块分析单元、一视觉认知单元及一输出单元。该影像分析单元加载一网页的数据并基于视觉特征将该网页的内容分割为多个区块。该区块分析单元基于每一区块的属性将所述区块分类。该视觉认知单元比较每一区块的至少一相对特征来判断该网页上每一区块的功能。该输出单元将所述区块与其功能汇集于一信息界面,并输出该信息界面。 | ||
搜索关键词: | 视觉 网页 分析 系统 方法 | ||
【主权项】:
1.一种视觉网页分析系统,用于视觉分析一网页上的数据,其特征在于,该系统包括:/n一影像分析单元,用以加载一网页数据,由外部的摄影机拍摄,或执行程序撷取整个该网页成为一影像,并基于该网页的该影像的至少一视觉特征来划分该网页上的区块;/n一区块分析单元,基于每一区块的至少一属性将所述区块归类,用以辅助判断所述区块的基本功能;/n一视觉认知单元,比对每一区块的至少一相对特征来判断每一区块于该网页上的功能;以及/n一输出单元,将所述区块与其功能汇集于一信息界面,并输出该信息界面;/n其中,影像分析单元、区块分析单元、视觉认知单元和输出单元是通过一微处理器进行处理,据以分析出网页上的物件及所述物件的功能,并显示于该信息界面上;/n其中,该影像分析单元将依区块分割后的网页数据传送至该区块分析单元,所述区块分析单元是透过一图片超链接程度、一文字比例、一图片文字比值、一同网域文字超链接程度及一同网域图片超链接程度其中至少之一者对每一区块进行属性分析及归类,或者所述区块分析单元是透过所述图片超链接程度、所述文字比例、所述图片文字比值、所述同网域文字超链接程度、所述同网域图片超链接程度及一文字超链接程度其中至少之二者对每一区块进行属性分析及归类;/n文字超链接程度=该区块中的文字超链接数量/该区块中的文字标签数量,/n其中该文字标签是指HTML里的语法,其为任何用以显示文字的语法指令;/n图片超链接程度=该区块中的超链接图片数量/该区块中的图片标签数量,/n其中该图片标签是指HTML里的语法,其为任何用以显示图片的语法指令;/n文字比例=该区块中的字符数量/整个网页中的字符数量,/n其中字符数量即为文字数量;/n图片文字比值=该区块中的图片标签数量/该区块中的文字标签数量,/n其中该图片文字比值用于计算该区块中图片标签数量与文字标签数量的比值;/n同网域文字超链接程度=该区块中的同网域文字超链接数量/该区块中的文字超链接数量,其中该同网域文字超链接是指所述文字超链接都链接于相同的网域;/n同网域图片超链接程度=该区块中的同网域图片超链接数量/该区块中的图片超链接数量,其中该同网域图片超链接是指所述图片超链接都链接于相同的网域。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李光耀,未经李光耀许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510204481.2/,转载请声明来源钻瓜专利网。
- 上一篇:数值处理方法及装置
- 下一篇:信息处理方法、信息处理装置及用户设备