[发明专利]一种服务接口子类模板确定方法与系统在审
申请号: | 202010753686.7 | 申请日: | 2020-07-30 |
公开(公告)号: | CN111913693A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 易超;张舒汇;贺赞贤 | 申请(专利权)人: | 北京数立得科技有限公司 |
主分类号: | G06F8/20 | 分类号: | G06F8/20 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种服务接口子类模板确定方法与系统。通过该方法,首先根据用户选定的模板大类,按照优先级获得模板大类下的各个子类模板;利用各个子类模板对web页面中的待提取数据进行提取操作,获得针对各个子类模板的提取结果;根据提取结果和待提取数据所在的原始DOM块之间的结构相似性,对每个子类模板的适应性进行评估;选择适应性高于指预设阈值的预设数量个子类模板进一步分析,分析内容包括:key‑value饱和度、key值语义含量、key值重复度以及与预期结果的结构相似性;根据分析结果获得待推荐的子类模板。该方法提升子类模板选择的准确率与效率,可针对Web页面的结构推荐出数据提取效果最好的子类模板,进而提升数据提取的准确率与效率。 | ||
搜索关键词: | 一种 服务 接口 子类 模板 确定 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数立得科技有限公司,未经北京数立得科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010753686.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种接口数据按需存储的方法和系统
- 下一篇:一种粗细等高线生成方法与装置