[发明专利]用于提高统一资源定位符提取准确率的方法和设备有效
申请号: | 201210326012.4 | 申请日: | 2012-09-03 |
公开(公告)号: | CN103678333B | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 张良 | 申请(专利权)人: | 北京千橡网景科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 100041 北京市石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 提高 统一 资源 定位 提取 准确率 方法 设备 | ||
1.一种用于提高统一资源定位符提取准确率的方法,包括:
使用根据规则从原始数据中提取的原始统一资源定位符进行网络访问;
当所述网络访问失败时,修改所述原始数据中的原始统一资源定位符以获得最终统一资源定位符;
根据所述最终统一资源定位符修改所述规则。
3.根据权利要求2所述的方法,进一步包括根据所述原始统一资源定位符和所述最终统一资源定位符修改所述规则。
4.根据权利要求1所述的方法,其中所述修改所述原始数据中的原始统一资源定位符以获得最终统一资源定位符可以是多次修改。
5.根据权利要求4所述的方法,其中所述修改包括在所提取的上一统一资源定位符之后增加在所述原始数据中紧接其后的字符。
6.根据权利要求4所述的方法,其中所述修改包括删除所提取的上一统一资源定位符中最后的字符。
7.根据权利要求2-3中任一项所述的方法,其中修改所述规则包括添加针对所述域名的规则。
8.一种用于提高统一资源定位符提取准确率的设备,包括:
用于使用根据规则从原始数据中提取的原始统一资源定位符进行网络访问的装置;
用于当所述网络访问失败时修改所述原始数据中的原始统一资源定位符以获得最终统一资源定位符的装置;
用于根据所述最终统一资源定位符修改所述规则的装置。
9.根据权利要求8所述的设备,还包括:
用于计算所述最终统一资源定位符所涉及的域名的提取错误率的装置;
用于当所述提取错误率超出阈值时根据所述最终统一资源定位符修改所述规则的装置。
10.根据权利要求9所述的设备,进一步包括用于根据所述原始统一资源定位符和所述最终统一资源定位符修改所述规则的装置。
11.根据权利要求8所述的设备,其中所述修改所述原始数据中的原始统一资源定位符以获得最终统一资源定位符可以是多次修改。
12.根据权利要求11所述的设备,其中所述修改包括在所提取的上一统一资源定位符之后增加在所述原始数据中紧接其后的字符。
13.根据权利要求11所述的设备,其中所述修改包括删除所提取的上一统一资源定位符中最后的字符。
14.根据权利要求9-10中任一项所述的设备,其中用于修改所述规则的装置包括用于添加针对所述域名的规则的装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京千橡网景科技发展有限公司,未经北京千橡网景科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210326012.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自动台球机的摆球装置
- 下一篇:一种传感器安装座结构