[发明专利]用于创建可变长度输入的固定长度表示的过程在审
申请号: | 202080027387.3 | 申请日: | 2020-04-07 |
公开(公告)号: | CN114127733A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 亚登·雷森 | 申请(专利权)人: | 贝宝公司 |
主分类号: | G06F40/143 | 分类号: | G06F40/143;G06F40/154;G06F16/958;G06N3/08 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 杨佳婧 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 创建 可变 长度 输入 固定 表示 过程 | ||
1.一种计算机系统,包括:
一个或多个计算机可读存储器,所述一个或多个计算机可读存储器存储程序指令;以及
一个或多个处理器,所述一个或多个处理器被配置为执行所述程序指令以使所述系统执行包括以下项的操作:
识别从网站的标记语言文档中提取的第一标记语言部分是否对应于第一可操作元素,其中,所述第一标记语言部分是可变长度表示;
响应于识别出所述第一标记语言部分对应于所述第一可操作元素,利用递归神经网络(RNN)编码器来创建对应于所述第一标记语言部分的第一代码表示;
识别与一个或多个预定义的目标对应的第一附加信息;
创建最终的固定长度标记语言表示,其包括所述第一代码表示和所述第一附加信息;以及
将所述最终的固定长度标记语言表示输入到模型中。
2.根据权利要求1所述的计算机系统,所述操作还包括:
响应于识别出所述第一标记语言部分对应于所述第一可操作元素,创建对应于所述第一标记语言部分的第一嵌入式令牌序列。
3.根据权利要求1所述的计算机系统,其中,所述第一附加信息包括与所述网站上的网络爬虫的活动相关联的信息,或与所述标记语言文档中的一个或多个元素对应的信息。
4.根据权利要求3所述的计算机系统,其中,与所述标记语言文档中的一个或多个元素对应的信息包括将物品添加到数字购物车的指示,并且其中,所述一个或多个预定义的目标包括由所述网络爬虫访问所述网站的结帐页面。
5.根据权利要求1所述的计算机系统,所述操作还包括:
从所述模型接收输出,所述输出提供有关是否应该选择所述第一可操作元素的指示,其中,所述输出是基于对所述第一附加信息和所述一个或多个预定义的目标的分析来确定的。
6.根据权利要求1所述的计算机系统,所述操作还包括:
在识别出所述第一标记语言部分对应于所述第一可操作元素之前,校准所述RNN自动编码器,其中,所述RNN自动编码器包括RNN编码器和RNN解码器,并且其中,校准所述RNN自动编码器包括:
响应于识别出对应于第二可操作元素的第二标记语言部分,创建对应于所述第二标记语言部分的第二嵌入式令牌序列;
响应于创建所述第二嵌入式令牌序列,利用所述RNN编码器创建与所述第二嵌入式令牌序列对应的第二代码表示;
响应于将所述第二代码表示输入到RNN解码器中,接收第一组一个或多个概率向量;
根据所述第一组一个或多个概率向量确定第一输出;
通过将所述RNN解码器的所述第一输出与所述第二嵌入式令牌序列进行比较来确定损耗值;以及
基于所确定的损耗值,调整与所述RNN自动编码器相关联的一个或多个权重值。
7.根据权利要求6所述的计算机系统,其中,校准所述RNN自动编码器还包括:
响应于识别出对应于第三可操作元素的第三标记语言部分,创建对应于所述第三标记语言部分的第三嵌入式令牌序列;
响应于创建所述第三嵌入式令牌序列,利用所述RNN编码器创建与所述第三嵌入式令牌序列对应的第三代码表示;
将所述第三代码表示输入到所述RNN解码器中,并且基于将第二输出与所述第三嵌入式令牌序列进行比较,确定所述第二输出与所述第三嵌入式令牌序列之间存在收敛,所述第二输出是根据由所述RNN解码器输出的第二组一个或多个概率向量创建的;以及
基于确定所述第二输出与所述第三嵌入式令牌序列之间存在收敛,确定不需要对与所述RNN自动编码器相关联的所述一个或多个权重值进行调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝宝公司,未经贝宝公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080027387.3/1.html,转载请声明来源钻瓜专利网。