[发明专利]商品的验证方法及装置、存储介质和处理器在审
申请号: | 201910759843.2 | 申请日: | 2019-08-16 |
公开(公告)号: | CN112396484A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 贺国秀;康杨杨;蒋卓人;孙常龙;张琼;司罗 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/9535 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁;张文华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品 验证 方法 装置 存储 介质 处理器 | ||
本发明公开了一种商品的验证方法及装置、存储介质和处理器。其中,该方法包括:获取预设时间段内在平台上完成操作的目标商品;获取与目标商品关联的搜索数据,其中,搜索数据中包括至少一个在平台上操作目标商品过程中的搜索行为数据;将每个搜索行为数据输入搜索行为模型,得到与每个搜索行为数据对应的行为表达向量;基于每个搜索行为数据对应的行为表达向量确定目标商品是否为异常商品。本发明解决了由于商品卖家时常修改异常商品的信息造成对异常商品的验证效率较低的技术问题。
技术领域
本发明涉及商品信息处理领域,具体而言,涉及一种商品的验证方法及装置、存储介质和处理器。
背景技术
在电商领域,新零售平台由于其平台属性,有些商家会发布一些违规商品或异常,这类违规商品包括违法平台规则、挂羊头卖狗肉等特性。其特点是常用一些同义词甚至完全和商品不相关的词作为该商品的文本介绍内容,以此规避平台的防控机制。而这些商品仍然会被一些经验丰富的买家通过自己的搜寻技术将这些商品从海量的相似商品中找出,造成了这类商品在一定程度上的传播。由于这些传播会对平台、用户的购物体验造成较大的影响,因此平台需要采用技术手段发现这些违规商品。
相关技术中,对违规商品检测的方法主要有两类:第一类,基于关键词拦截结合人工判断的方法:由业务专家根据违规商品的特性和已经确认的违规商品信息总结、归纳、收集商品敏感字典。在敏感关键词拦截的基础上,进行人工校验,根据业务变化,调整增添敏感字典中的关键词。尽管这种方法可以快速拦截绝大多数违规商品,但是这种方式不够灵活,相对比较滞后,很难应付卖家创造的新词或者新的描述,而且容易造成误判。第二类,基于特征提取的机器学习或者深度学习方法,利用商品的文本信息作为特征,训练机器学习或者深度学习分类模型以理解商品文本中蕴含的语义。然而,由于违规商品的文本内容相对来说是比较隐晦或者和正常商品相似,所以已有的基于机器学习和深度学习的模型很难捕捉到有效的语义。同样,由于这些模型需要大量的训练语料,而这些由商品本身的信息如商品标题或者描述的数据很难很快的捕捉到其中的变化,训练好的模型相对于最新的场景总是一个旧模型,所以在线上的使用并不能非常好的满足业务需求。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种商品的验证方法及装置、存储介质和处理器,以至少解决由于商品卖家时常修改异常商品的信息造成对异常商品的验证效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种商品的验证方法,包括:获取预设时间段内在平台上完成操作的目标商品;获取与所述目标商品关联的搜索数据,其中,所述搜索数据中包括至少一个在所述平台上操作所述目标商品过程中的搜索行为数据;将每个搜索行为数据输入搜索行为模型,得到与每个搜索行为数据对应的行为表达向量;基于每个搜索行为数据对应的行为表达向量确定所述目标商品是否为异常商品。
进一步地,所述搜索行为数据至少包括:商品搜索词和访问商品的信息,其中,所述商品搜索词为买家在所述平台上购买目标商品过程中,用于搜索所述目标商品的搜索词,所述访问商品的信息是指在基于所述商品搜索词在所述平台上进行搜索,所述平台返回搜索结果之后,在所述搜索结果中所述买家访问过的商品的信息,将每个搜索行为数据输入搜索行为模型,得到与每个搜索行为数据对应的行为表达向量包括:获取所述商品搜索词对应的词向量矩阵以及所述访问商品的信息对应的词向量矩阵;对所述商品搜索词对应的词向量矩阵进行池化处理,得到词向量矩阵一,以及对所述访问商品的信息对应的词向量矩阵进行池化处理,得到词向量矩阵二;对所述词向量矩阵一和所述词向量矩阵二进行合并处理,得到目标矩阵;基于所述目标矩阵得到与每个搜索行为数据对应的行为表达向量。
进一步地,获取所述商品搜索词对应的词向量矩阵以及所述访问商品的信息对应的词向量矩阵包括:对所述商品搜索词进行分词处理,得到分词集合一;基于所述分词集合一中的每个词,确定所述商品搜索词对应的词向量矩阵;对所述访问商品的信息进行分词处理,得到分词集合二;基于所述分词集合二中的每个词,确定所述访问商品的信息对应的词向量矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910759843.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能母婴联动系统
- 下一篇:一种移动母婴智能呵护系统