[发明专利]网页内文抽取方法在审
申请号: | 202011014406.7 | 申请日: | 2020-09-24 |
公开(公告)号: | CN114254231A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 汤珮茹;陈宜均 | 申请(专利权)人: | 台达电子工业股份有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06V30/41 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 黄艳 |
地址: | 中国台*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种网页内文抽取方法,运用于电子装置并且包括:取得特定网页的网页截图及网页原始码;对网页截图进行辨识,以取得至少一个目标区块在网页截图中的位置,其中所述目标区块至少包括特定文字内容;对目标区块执行字元辨识处理,以取得所述特定文字内容;及,将特定文字内容与网页原始码的内容进行比对以取得与所述特定文字内容的相似度最高的特定原始码内文,并输出所述特定原始码内文以作为特定网页的网页内文。 | ||
搜索关键词: | 网页 内文 抽取 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于台达电子工业股份有限公司,未经台达电子工业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011014406.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种油甘茉绿茶
- 下一篇:检测设备及其收光装置