[发明专利]页面异常检测方法、装置及电子设备在审
申请号: | 202110838293.0 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113657361A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 陈砺;王鹏飞 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06N3/04;G06N3/08;G06F11/36 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 南海燕 |
地址: | 310000 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 页面 异常 检测 方法 装置 电子设备 | ||
1.一种页面异常检测方法,其特征在于,包括:
确定待检测的目标页面;
通过对用户浏览所述目标页面的过程进行模拟,获取所述目标页面的加载及渲染结果;
根据所述目标页面的加载及渲染结果确定目标图像;
基于所述目标图像的图像特征,对所述目标图像中的文本内容是否存在目标类型的异常进行检测。
2.根据权利要求1所述的方法,其特征在于,
所述确定待检测的目标页面,包括:
接收用户输入的检测对象的网络资源定位标识信息,以及指定的至少一种目标语言;
将所述网络资源定位标识信息在所述目标语言场景下对应的页面确定为所述目标页面。
3.根据权利要求1所述的方法,其特征在于,
所述根据所述目标页面的加载及渲染结果确定目标图像,包括:
对所述目标页面的加载及渲染结果进行截图,将截图结果确定为所述目标图像。
4.根据权利要求1所述的方法,其特征在于,
所述基于所述目标图像的图像特征,对所述目标图像中的文本内容是否存在目标类型的异常进行检测,包括:
从所述目标图像中识别出至少一个文本区块,所述文本区块中包括文本内容;
以所述文本区块为单位,对所述文本区块中包含的文本内容是否存在目标类型的异常进行检测。
5.根据权利要求4所述的方法,其特征在于,
所述目标类型的异常包括:文本内容被遮挡;
所述对所述文本区块中包含的文本内容是否存在目标类型的异常进行检测,包括:
将所述文本区块输入到第一算法模型中进行预测,根据所述第一算法模型输出的预测结果,确定所述文本区块中的文本内容是否存在被遮挡的异常。
6.根据权利要求4所述的方法,其特征在于,
所述目标类型的异常包括:文本内容被缩略;
所述方法还包括:
对所述文本区块所关联的资源类型进行识别;
将非可交互类的资源对应的文本区块确定为需要对缩略问题进行检测的目标文本区块;
所述对所述文本区块中包含的文本内容是否存在目标类型的异常进行检测,包括:
通过将所述目标文本区块输入到第二算法模型中进行缩略标记的识别,并根据识别结果确定所述目标文本区块中的文本内容是否被缩略。
7.根据权利要求4所述的方法,其特征在于,
所述目标类型的异常包括:文本内容被截断;
所述对所述文本区块中包含的文本内容是否存在目标类型的异常进行检测,包括:
将所述文本区块输入到第三算法模型中进行预测,根据所述第三算法模型输出的预测结果,确定所述文本区块中的文本内容是否存在被截断的异常。
8.根据权利要求7所述的方法,其特征在于,还包括:
对所述文本区块中的文本内容进行垂直投影,并对投影结果的连通性进行分析;
所述确定所述文本区块中的文本内容是否存在被截断的异常,包括:
根据所述第三算法模型输出的预测结果,以及所述连通性分析结果,确定所述文本区块中的文本内容是否存在被截断的异常。
9.根据权利要求4所述的方法,其特征在于,
所述目标类型的异常包括:文本内容在翻译过程中被遗漏的异常;
所述对所述文本区块中包含的文本内容是否存在目标类型的异常进行检测,包括:
通过将所述文本区块输入到第四算法模型中,对所述文本区块中的文本内容进行语言种类识别;
通过判断语言种类识别结果与所述目标页面关联的目标语言是否相同,判断对应的文本区块中的文本内容是否存在在翻译过程中被遗漏的异常。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110838293.0/1.html,转载请声明来源钻瓜专利网。