[发明专利]信息处理方法、装置、电子设备及介质有效
申请号: | 201910957683.2 | 申请日: | 2019-10-09 |
公开(公告)号: | CN110659701B | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 何天琪;程建波;彭南博 | 申请(专利权)人: | 京东科技控股股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/82;G06V10/774;G06F16/31;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕朝蕙 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 电子设备 介质 | ||
本公开提供了一种信息处理方法,包括:获取样本数据,该样本数据表征目标用户、目标物品及目标用户在第一时刻对目标物品执行p种预定操作的操作信息;获取目标用户的用户信息及目标物品的第一物品信息;将用户信息及第一物品信息输入特征提取模型,提取得到特征向量;采用预测模型处理特征向量,得到目标用户对目标物品执行p种预定操作中每种预定操作的预测置信度;以及根据操作信息及预测置信度,优化特征提取模型。其中,用户信息和/或第一物品信息包括以下至少两种类型的信息:特征信息、图像信息和文本信息,p为大于1的自然数。本公开还提供了一种信息处理装置、一种电子设备及一种计算机可读存储介质。
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种信息处理方法、装置、电子设备及介质。
背景技术
近年来,随着电子商务的迅速发展和用户交互信息的爆炸式增长,从多类型、多维度的信息中提取用户特征成为影响推荐系统效果的重要因素。
在实现本公开构思的过程中,发明人发现现有技术中至少存在以下问题:现有的特征提取方法包括基于传统机器学习算法进行提取和基于时间序列深度学习算法进行提取。其中,基于传统机器学习算法进行提取(如协同过滤)仅能利用用户的交互信息,无法处理文本和图像等非结构化信息,从而存在大量数据浪费,特征提取效果较差的缺陷。基于时间序列深度学习算法需要人为在时间维度进行特征处理,处理方式相对固定,需要非常强的专家先验知识,并不能很好的处理时间序列类特征。
发明内容
有鉴于此,本公开提供了一种能够融合多种不同类型数据进行特征提取的信息处理方法、装置、电子设备及介质。
本公开的一个方面提供了一种信息处理方法,包括:获取样本数据,该样本数据表征目标用户、目标物品及目标用户在第一时刻对目标物品执行p种预定操作的操作信息;获取目标用户的用户信息及目标物品的第一物品信息;将用户信息及第一物品信息输入特征提取模型,提取得到特征向量;采用预测模型处理特征向量,得到目标用户对目标物品执行p种预定操作中每种预定操作的预测置信度;以及根据操作信息及预测置信度,优化特征提取模型,其中,用户信息和/或第一物品信息包括以下至少两种类型的信息:特征信息、交互记录信息、图像信息和文本信息,p为大于1的自然数。
根据本公开的实施例,上述特征提取模型包括针对至少两种类型的信息的至少两个提取子模型,以分别提取得到至少两种类型的信息的特征子向量,特征向量根据至少两种类型的信息的特征子向量得到。
根据本公开的实施例,上述用户信息包括:用户特征信息及在第一时刻之前的交互记录信息,该交互记录信息包括n个预定操作所针对物品的n个第二物品信息及n个预定操作所针对的n个第一时间信息;物品信息包括物品特征信息,n为大于1的自然数。上述提取得到特征向量包括:将第一物品信息包括的第一物品特征信息及用户特征信息分别输入第一转换模型,得到针对第一物品特征信息的第一特征子向量以及针对用户特征信息的第二特征子向量;将n个第二物品信息包括的n个第二物品特征信息及n个第一时间信息配对组合,得到n个第一输入信息;以及根据n个第一时间信息表征的n个第二时刻的先后顺序,将n个第一输入信息依次输入第一循环神经网络模型,得到第三特征子向量。其中,特征向量根据第一特征子向量、第二特征子向量以及第三特征子向量得到;针对特征信息的提取子模型包括第一转换模型和第一循环神经网络模型。
根据本公开的实施例,上述物品信息还包括物品图像信息;上述提取得到特征向量还包括:将n个第二物品信息包括的n个第二物品图像信息依次输入卷积神经网络模型,得到针对n个第二物品图像信息的n个第一向量;将n个第一向量及n个第一时间信息配对组合,得到n个第二输入信息;根据n个第一时间信息表征的n个第二时刻的先后顺序,将n个第二输入信息依次输入第二循环神经网络模型,得到第四特征子向量;以及将第一物品信息包括的第一物品图像信息输入卷积神经网络模型中,得到第五特征子向量。其中,特征向量还根据第四特征子向量和第五特征子向量得到;针对图像信息的提取子模型包括卷积神经网络模型和第二循环神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910957683.2/2.html,转载请声明来源钻瓜专利网。