[发明专利]目标页面展示方法、装置、计算机设备及存储介质在审

申请号：	202111118207.5	申请日：	2021-09-22
公开（公告）号：	CN113920509A	公开（公告）日：	2022-01-11
发明（设计）人：	张博伟;董思文	申请（专利权）人：	北京三快在线科技有限公司
主分类号：	G06V30/148	分类号：	G06V30/148;G06F16/955;G06F16/958;G06V30/14
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	谢冬寒
地址：	100080 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	目标页面展示方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开揭示了一种目标页面展示方法、装置、计算机设备及存储介质，属于人工智能技术领域。该方法包括：获取目标页面的页面截图；基于所述页面截图，获取所述目标页面的页面数据，所述页面数据包括文字内容集合以及图片内容集合中的至少一种；将所述页面数据输入到页面识别模型中，获取目标页面信息；所述页面识别模型是通过页面样本的样本页面数据训练得到的；所述目标页面信息用于指示目标页面的位置信息；基于所述目标页面信息，跳转展示所述目标页面。通过页面识别模型进行目标页面识别不受限于开源环境，从而解决了可识别的目标页面局限性的问题，从而提高了目标页面识别的准确性。

技术领域

本公开涉及人工智能技术领域，特别是涉及一种目标页面展示方法、装置、计算机设备及存储介质。

背景技术

目前，可以通过训练的分类器识别出开源页面，并且获取开源页面中的开源软件资源。

在相关技术中，根据所训练出的分类器识别出目标页面是否为开源软件页面。然后，通过在所识别出的开源软件页面中查找开源软件资源并将其下载到本地，以实现对开源软件资源的提取过程。

然而，相关技术中的方案，通过训练出的分类器识别页面是否为开源软件页面，仅针对开源软件页面跳转到开源软件资源的下载页面对开源软件资源进行下载，从而导致支持跳转的目标页面具有局限性。

发明内容

本公开提供一种目标页面展示方法、装置、计算机设备及存储介质。所述技术方案如下：

一方面，提供了一种目标页面展示方法，所述方法包括：

获取目标页面的页面截图；

基于所述页面截图，获取所述目标页面的页面数据，所述页面数据包括文字内容集合以及图片内容集合中的至少一种；

将所述页面数据输入到页面识别模型中，获取目标页面信息；所述页面识别模型是通过样本页面的样本页面数据训练得到的；所述目标页面信息用于指示目标页面的位置信息；