[发明专利]一种基于视觉画像的数据处理方法及系统在审
申请号: | 201911294265.6 | 申请日: | 2019-12-16 |
公开(公告)号: | CN111047360A | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 陈阔;白旭栩;李林;刘志超;于靓环 | 申请(专利权)人: | 北京搜狐新媒体信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 古利兰 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视觉 画像 数据处理 方法 系统 | ||
本发明提供了一种基于视觉画像的数据处理方法及系统,根据用户信息,获取用户的视觉画像向量;确定每个预设的项目向量与视觉画像向量的相似度,获取相似度最大的K个项目向量对应的第一项目;获取通过其它预设方式确定的与用户信息相关的M个第二项目;对K个第一项目和M个第二项目进行筛选,获取N个第三项目;将N个第三项目反馈给用户。本方案中,预先构建用户的视觉画像向量,利用向量之间的相似度,获取与视觉画像向量相似度最大的K个项目向量对应的第一项目,以及获取通过其它方式确定的M个第二项目。对K个第一项目和M个第二项目进行筛选,将得到的N个第三项目反馈给用户。充分利用行为数据中的视觉信息,准确表达用户的兴趣爱好。
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于视觉画像的数据处理方法及系统。
背景技术
随着互联网技术的发展,越来越多的互联网产品会构建用户对应的用户画像,以表达用户的兴趣爱好。
目前构建用户画像的方式为:收集用户的行为数据,根据行为数据中的文本构建语义用户画像。但是随着5G和人工智能(Artificial Intelligence,AI)等领域的发展,视觉特征的应用越来越广泛。仅根据行为数据中的文本构建语义用户画像,会忽略承载行为数据中的大量关键信息的视觉信息,也就是说语义用户画像无法准确表达用户的兴趣爱好。
发明内容
有鉴于此,本发明实施例提供一种基于视觉画像的数据处理方法及系统,以解决现有构建用户画像的方式无法准确表达用户的兴趣爱好的问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种基于视觉画像的数据处理方法,所述方法包括:
根据用户信息,获取用户的视觉画像向量,所述视觉画像向量为预先基于所述用户的行为数据构建的;
确定每个预设的项目向量与所述视觉画像向量的相似度,获取相似度最大的K个所述项目向量对应的第一项目,所述项目向量为将对应项目的图像转换成向量得到;
获取通过其它预设方式确定的与所述用户信息相关的M个第二项目;
对K个所述第一项目和M个所述第二项目进行筛选,获取N个第三项目;
将N个所述第三项目反馈给所述用户;
其中,K,M和N为正整数。
优选的,预先基于所述用户的行为数据构建所述视觉画像向量的过程,包括:
获取在预设时间段内所述用户操作过的多个历史操作项目;
对多个所述历史操作项目分类,获取一个以上的历史操作项目类别;
获取每个所述历史操作项目对应的历史操作项目向量;
针对每一所述历史操作项目类别,对所述历史操作项目类别对应的历史操作项目向量进行加权求和,获取所述历史操作项目类别对应的视觉画像向量。
优选的,所述对K个所述第一项目和M个所述第二项目进行筛选,获取N个第三项目,包括:
确定K个所述第一项目中每个所述第一项目的点击率;
确定M个所述第二项目中每个所述第二项目的点击率;
获取K个所述第一项目和M个所述第二项目中点击率最高的N个第三项目。
优选的,所述确定每个预设的项目向量与所述视觉画像向量的相似度,获取相似度最大的K个所述项目向量对应的第一项目,包括:
针对每一所述历史操作项目类别对应的视觉画像向量,确定每个预设的项目向量与所述视觉画像向量的相似度,获取相似度最大的X个所述项目向量对应的第一项目;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狐新媒体信息技术有限公司,未经北京搜狐新媒体信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911294265.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:润滑油存取装置
- 下一篇:一种马氏体不锈钢薄板及其热处理的板形控制方法