[发明专利]一种基于视觉画像的数据处理方法及系统在审

申请号：	201911294265.6	申请日：	2019-12-16
公开（公告）号：	CN111047360A	公开（公告）日：	2020-04-21
发明（设计）人：	陈阔;白旭栩;李林;刘志超;于靓环	申请（专利权）人：	北京搜狐新媒体信息技术有限公司
主分类号：	G06Q30/02	分类号：	G06Q30/02
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	古利兰
地址：	100190 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于视觉画像数据处理方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种基于视觉画像的数据处理方法及系统，根据用户信息，获取用户的视觉画像向量；确定每个预设的项目向量与视觉画像向量的相似度，获取相似度最大的K个项目向量对应的第一项目；获取通过其它预设方式确定的与用户信息相关的M个第二项目；对K个第一项目和M个第二项目进行筛选，获取N个第三项目；将N个第三项目反馈给用户。本方案中，预先构建用户的视觉画像向量，利用向量之间的相似度，获取与视觉画像向量相似度最大的K个项目向量对应的第一项目，以及获取通过其它方式确定的M个第二项目。对K个第一项目和M个第二项目进行筛选，将得到的N个第三项目反馈给用户。充分利用行为数据中的视觉信息，准确表达用户的兴趣爱好。

技术领域

本发明涉及数据处理技术领域，具体涉及一种基于视觉画像的数据处理方法及系统。

背景技术

随着互联网技术的发展，越来越多的互联网产品会构建用户对应的用户画像，以表达用户的兴趣爱好。

目前构建用户画像的方式为：收集用户的行为数据，根据行为数据中的文本构建语义用户画像。但是随着5G和人工智能(Artificial Intelligence，AI)等领域的发展，视觉特征的应用越来越广泛。仅根据行为数据中的文本构建语义用户画像，会忽略承载行为数据中的大量关键信息的视觉信息，也就是说语义用户画像无法准确表达用户的兴趣爱好。

发明内容

有鉴于此，本发明实施例提供一种基于视觉画像的数据处理方法及系统，以解决现有构建用户画像的方式无法准确表达用户的兴趣爱好的问题。

为实现上述目的，本发明实施例提供如下技术方案：

本发明实施例第一方面公开一种基于视觉画像的数据处理方法，所述方法包括：

根据用户信息，获取用户的视觉画像向量，所述视觉画像向量为预先基于所述用户的行为数据构建的；

确定每个预设的项目向量与所述视觉画像向量的相似度，获取相似度最大的K个所述项目向量对应的第一项目，所述项目向量为将对应项目的图像转换成向量得到；

获取通过其它预设方式确定的与所述用户信息相关的M个第二项目；

对K个所述第一项目和M个所述第二项目进行筛选，获取N个第三项目；

将N个所述第三项目反馈给所述用户；

其中，K，M和N为正整数。

优选的，预先基于所述用户的行为数据构建所述视觉画像向量的过程，包括：

获取在预设时间段内所述用户操作过的多个历史操作项目；