[发明专利]一种网页分类方法和系统在审
申请号: | 201510484991.X | 申请日: | 2015-08-07 |
公开(公告)号: | CN105117434A | 公开(公告)日: | 2015-12-02 |
发明(设计)人: | 林招;洪婷婷;杨晓磊;陈岩 | 申请(专利权)人: | 北京品友互动信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汉昊知识产权代理事务所(普通合伙) 11370 | 代理人: | 朱海波 |
地址: | 100022 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的目的是提供一种网页分类方法和系统,其中,待分类网页获取装置接收用户输入的域名,基于所述域名得到需要爬取面包屑的网页所对应的地址(url),面包屑爬取装置基于所述地址爬取所述网页的面包屑,网页分类器基于所爬取的面包屑对所述网页进行分类。与现有技术相比,本发明通过基于域名从网页中提取面包屑,对网页进行分类,有效提升了网页分类的准确率。 | ||
搜索关键词: | 一种 网页 分类 方法 系统 | ||
【主权项】:
一种网页分类方法,该方法包括以下步骤:接收用户输入的域名,基于所述域名得到需要爬取面包屑的网页所对应的地址;基于所述地址爬取所述网页的面包屑;基于所爬取的面包屑对所述网页进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京品友互动信息技术有限公司,未经北京品友互动信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510484991.X/,转载请声明来源钻瓜专利网。