[发明专利]搜索引擎优化方法及装置、电子设备及可读存储介质在审
申请号: | 202210176355.0 | 申请日: | 2022-02-24 |
公开(公告)号: | CN114528513A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 华嘉炜;胡杨;陆源源;余婷婷;朱茵茵;华镇;虞金花;汪沁 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/957 | 分类号: | G06F16/957;G06F16/953;G06F16/951;G06F16/958 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索引擎 优化 方法 装置 电子设备 可读 存储 介质 | ||
1.一种搜索引擎优化方法,其特征在于,包括:
获取目标页面的视觉信息;
根据所述视觉信息确定目标页面中的页面标题以及核心文本;
根据所述页面标题以及所述核心文本对目标页面进行收录。
2.根据权利要求1所述的方法,其特征在于,获取目标页面的视觉信息,包括:
遍历所述目标页面的页面内容,以得到所述目标页面的页面文档;
在所述页面文档中注入预设脚本,以得到所述目标页面对应的视图树;
根据所述视图树得到所述视觉信息。
3.根据权利要求2所述的方法,其特征在于,在所页面文档中注入预设脚本,以得到所述目标页面对应的视图树,包括:
在所述目标页面为HTML页面的情况下,将预设脚本注入至所述HTML页面的预设接口;或,
在所述目标页面为应用程序页面的情况下,在所述应用程序页面对应的应用程序源码中增加预设脚本。
4.根据权利要求2所述的方法,其特征在于,根据所述视图树得到所述视觉信息,包括:
遍历所述视图树;
获取所述视图树中的每个节点的节点属性;
根据所述节点属性生成所述目标页面对应的视觉文档,其中,所述视觉文档中包括所述视觉信息。
5.根据权利要求4所述的方法,其特征在于,在根据所述节点属性生成所述目标页面对应的视觉文档之后,还包括:
获取所述视觉文档中每个节点的可见性信息;
根据所述可见性信息对所述每个节点对应的页面内容进行筛选。
6.根据权利要求1所述的方法,其特征在于,根据所述视觉信息确定目标页面中的页面标题以及核心文本,包括:
将所述视觉信息对应的视觉信息特征、所述目标页面的页面特征、所述目标页面的文本语言特征输入至预先训练完成的页面标题预测模型,以得到所述目标页面的页面标题;
将所述视觉信息特征、所述目标页面中核心区域的内容特征输入至预先训练完成的核心文本预测模型,以得到所述目标页面的核心文本。
7.根据权利要求6所述的方法,其特征在于,
所述页面特征包括以下至少之一:
所述目标页面的HTML页面特征、DOM特征;
所述内容特征包括以下至少之一:
所述核心区域的文本特征、图片特征以及链接特征。
8.一种搜索引擎优化装置,其特征在于,包括:
获取单元,用于获取目标页面的视觉信息;
确定单元,用于根据所述视觉信息确定目标页面中的页面标题以及核心文本;
优化单元,用于根据所述页面标题以及所述核心文本对目标页面进行收录。
9.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-7所述的搜索引擎优化方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-7所述的搜索引擎优化方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210176355.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:同心圆氢瓶集成模组
- 下一篇:一种便于组合拆装的通信塔及其安装方法