[发明专利]一种标签校验方法、装置、设备和存储介质在审
申请号: | 202010239481.7 | 申请日: | 2020-03-30 |
公开(公告)号: | CN111767738A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 李飞 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F16/33;G06Q30/02 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标签 校验 方法 装置 设备 存储 介质 | ||
1.一种标签校验方法,其特征在于,包括:
获取目标物品信息和待校验的目标物品标签;
确定与所述目标物品标签匹配的目标搜索关键词;
将所述目标物品信息和所述目标搜索关键词输入至预设语义匹配模型中,其中,所述预设语义匹配模型预先基于样本物品的搜索曝光点击率进行训练获得;
根据所述预设语义匹配模型的输出确定所述目标物品信息与所述目标搜索关键词之间的目标匹配度,并根据所述目标匹配度确定所述目标物品标签对应的校验结果。
2.根据权利要求1所述的方法,其特征在于,确定与所述目标物品标签匹配的目标搜索关键词,包括:
对所述目标物品标签进行相似标签扩充,确定所述目标物品标签对应的目标相似标签;
将所述目标物品标签与搜索数据库中的各个搜索关键词进行匹配,确定与所述目标物品标签匹配的第一搜索关键词,以及将所述目标相似标签与搜索数据库中的各个搜索关键词进行匹配,确定与所述目标相似标签匹配的第二搜索关键词;
将所述第一搜索关键词和所述第二搜索关键词确定为目标搜索关键词。
3.根据权利要求2所述的方法,其特征在于,对所述目标物品标签进行相似标签扩充,确定所述目标物品标签对应的目标相似标签,包括:
获取物品数据库中的各个物品信息和搜索数据库中的各个搜索关键词的分词结果;
根据所述分词结果,确定与所述目标物品标签共现的各个相似词以及每个所述相似词对应的共现次数;
根据各所述共现次数,从各个所述相似词中确定所述目标物品标签对应的目标相似标签。
4.根据权利要求2所述的方法,其特征在于,将所述目标物品标签与搜索数据库中的各个搜索关键词进行匹配,确定与所述目标物品标签匹配的第一搜索关键词,以及将所述目标相似标签与搜索数据库中的各个搜索关键词进行匹配,确定与所述目标相似标签匹配的第二搜索关键词,包括:
获取根据标签数据库中的各个物品标签创建的字典树,以及所述字典树中的每个节点对应的失败指针,其中所述失败指针用于在相应节点的字符匹配失败时跳转至所指向的节点;
基于所述字典树和所述字典树中的失败指针,将搜索数据库中的各个搜索关键词与所述各个物品标签进行字符匹配,确定每个搜索关键词对应的匹配物品标签;
根据每个搜索关键词对应的匹配物品标签,确定与所述目标物品标签匹配的第一搜索关键词,以及与所述目标相似标签匹配的第二搜索关键词。
5.根据权利要求1所述的方法,其特征在于,所述预设语义匹配模型包括:词向量序列确定子模型、预设循环网络子模型和匹配度确定子模型;其中,
所述词向量序列确定子模型用于:对输入的所述目标物品信息和所述目标搜索关键词分别进行分词处理,并确定所述目标物品信息对应的第一词向量序列和所述目标搜索关键词对应的第二词向量序列,并将所述第一词向量序列和所述第二词向量序列输入至所述预设循环网络子模型中;
所述预设循环网络子模型用于:对输入的所述第一词向量序列和所述第二词向量序列进行向量整合,确定所述目标物品信息对应的第一文本向量和所述目标搜索关键词对应的第二文本向量,并将所述第一文本向量和所述第二文本向量输入至所述匹配度确定子模型中;
所述匹配度确定子模型用于:对输入的所述第一文本向量和所述第二文本向量进行向量匹配,确定所述目标物品信息与所述目标搜索关键词之间的目标匹配度,并输出所述目标匹配度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010239481.7/1.html,转载请声明来源钻瓜专利网。