[发明专利]一种判别网页类型的方法及装置有效
申请号: | 201611270198.0 | 申请日: | 2016-12-29 |
公开(公告)号: | CN108255891B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 郑立颖 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 古利兰;王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种判别网页类型的方法,包括:获取待判断网页的页面信息;从页面信息中提取出标题信息;判断标题信息中是否包含预设关键字,预设关键字为包含网页类型的关键字;若标题信息中未包含预设关键字,基于页面信息所对应的页面结构信息和/或所述标题信息得到待判断网页的网页类型。本发明能够解决现有技术中依赖人工方式进行网页类型分类效率低的问题。本发明还公开了一种判别网页类型的装置。 | ||
搜索关键词: | 一种 判别 网页 类型 方法 装置 | ||
【主权项】:
1.一种判别网页类型的方法,其特征在于,包括:获取待判断网页的页面信息;从所述页面信息中提取出标题信息;判断所述标题信息中是否包含预设关键字,所述预设关键字为包含网页类型的关键字;若所述标题信息中未包含所述预设关键字,基于所述页面信息所对应的页面结构信息和/或所述标题信息得到所述待判断网页的网页类型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611270198.0/,转载请声明来源钻瓜专利网。
- 上一篇:页面的处理方法和装置
- 下一篇:Cookie生命周期的计算方法及装置