[发明专利]一种网页多重属性的标记方法及其实现在审
申请号: | 201410176809.X | 申请日: | 2014-04-30 |
公开(公告)号: | CN104679804A | 公开(公告)日: | 2015-06-03 |
发明(设计)人: | 王建平 | 申请(专利权)人: | 宁波优策信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 无 | 代理人: | 无 |
地址: | 315100 浙江省宁波市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明一种网页多重属性的标记方法及其实现,涉及网页信息处理领域,通过提供网页多重信息属性标记处理的属性识别模块、属性配置模块和属性调用模块,主要从整体、系统角度解决对抓取网页的多重信息属性进行识别与存储、多方式标记以及对属性标记结果与过程进行灵活可重复调用的问题。与现有技术方案相比,本发明通过定义网页多重信息属性识别模型及标记过程,提出了一种统一的对网页多重信息属性进行标记的新方法,可以有效升网页信息属性标记处理的效率和准确率,从而为网页多重信息属性标记结果与过程在业务处理中的便捷重复调用奠定基础,能够有效提升需要处理网页多重信息属性业务系统的效率。 | ||
搜索关键词: | 一种 网页 多重 属性 标记 方法 及其 实现 | ||
【主权项】:
一种网页多重属性的标记方法及其实现,实现后装置包括三个模块:A.属性识别模块,用于定义网页多重信息属性模型并识别网页的多重信息属性向量,并根据业务需求,定义出属性域向量;B. 属性配置模块,根据属性类别的属性域取值是否确定,通过直接赋值或技术手段赋值,对网页的多维信息属性向量赋予确定的值;C. 属性调用模块,用于设置网页信息属性调用方法与技术接口规范;所述实现方法核心包括:步骤A:处理抓取的网页数据与信息,确定信息属性类别和某个类别的属性域,生成网页属性向量;步骤B:针对实际业务需求,设置属性值向量并对属性值向量赋值;步骤C:对标记好的网页信息属性定义调用方法与接口规范。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波优策信息技术有限公司;,未经宁波优策信息技术有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410176809.X/,转载请声明来源钻瓜专利网。
- 上一篇:基于语义标注的异构数据关联方法及系统
- 下一篇:旅游规划装置以及旅游规划方法