[发明专利]一种用户深度画像方法及装置在审
申请号: | 201810633410.8 | 申请日: | 2018-06-19 |
公开(公告)号: | CN108804704A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 黄亚军 | 申请(专利权)人: | 北京顶象技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 徐丽 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 画像 抽象数据 原始数据 学习神经网络 目标函数 数据表征 数据类型 用户数据 建模 多维空间 模型设计 数据挖掘 隐私数据 大数据 多业务 屏蔽 映射 抽象 场景 保留 转化 学习 | ||
本发明提供了一种用户深度画像方法及装置,涉及大数据用户画像技术领域。所述用户深度画像方法首先获取用户的原始数据,确定所述原始数据的数据类型,并根据所述数据类型,对所述原始数据进行抽象转化处理,获得抽象数据,然后确定与所述抽象数据的类型对应的表征学习神经网络,采用所述表征学习神经网络对所述抽象数据进行建模,获得数据表征模型,再根据所述数据表征模型设计并训练所述表征学习模型的目标函数,并利用所述目标函数对所述用户进行深度画像,获得用户深度画像。所述用户深度画像方法将用户数据映射到多维空间进行建模和用户深度画像,保留了更多的用户数据,同时屏蔽了隐私数据,更适用于复杂的数据挖掘和多业务场景。
技术领域
本发明涉及大数据用户画像技术领域,具体而言,涉及一种用户深度画像方法及装置。
背景技术
随着互联网的迅速发展和普及,人们的更多行为被信息化和数据化,大数据技术是以任何系统的全部数据资源为对象并从中发现数据之间表现的相关性关系的信息处理技术,目前已经广泛应用于互联网的流程优化、目标化消息及广告推送、用户个性化服务与改善等方面,成为了网络服务背后强大的后台支撑。通过大数据处理方式对众多用户的数据进行处理能够获得用户的群体行为趋势,而对用户数据进行人工筛选和分析会耗费大量的人力物力,运营成本极高,另一方面,通过人为分析得到的用户分析结果不精准,存在用户定位不准确的问题。因此现在大多采用用户画像方式对用户的大数据进行抽象提炼从而获得用户模型,其具备自动化程度高、速度快、用户分析精准等优点。
但是,目前的用户画像的数据建模主要是数据标签形式,标签是基于业务场景制定,对用户某一维度的数据标识,如性别、学历、消费倾向等。标签画像虽然因可解释强、易应用于业务策略而被广泛使用,但存在不同业务间可复用性差,对数据的表达能力弱,以及标签容易泄露数据信息的问题。
发明内容
有鉴于此,本发明实施例的目的在于提供一种用户深度画像方法及装置,以解决上述现有技术中用户画像的数据表达能力弱、标签容易泄露数据信息的问题。
第一方面,本发明实施例提供了一种用户深度画像方法,所述用户深度画像方法包括:获取用户的原始数据,确定所述原始数据的数据类型;根据所述数据类型,对所述原始数据进行抽象转化处理,获得抽象数据;确定与所述抽象数据的类型对应的表征学习神经网络,采用所述表征学习神经网络对所述抽象数据进行建模,获得数据表征模型;根据所述数据表征模型设计并训练所述表征学习模型的目标函数,并利用所述目标函数对所述用户进行深度画像,获得用户深度画像。
综合第一方面,所述根据所述表征数据设计并训练所述表征学习模型的目标函数,包括:确定所述表征数据的标签标注情况;根据所述标签标注情况确定采用有监督学习方式、无监督学习方式、半监督学习方式或强化学习方式,根据所述表征数据设计并训练所述表征学习模型的目标函数。
综合第一方面,在所述利用所述表征数据设计并训练所述表征学习模型的目标函数之后,所述用户深度画像方法还包括:确定与所述表征学习模型对应的损失函数;采用所述损失函数验证所述表征数据在所述表征学习模型的训练中的收敛效果。。
综合第一方面,在所述利用所述目标函数对所述用户进行深度画像,获得用户深度画像之后,所述用户深度画像方法还包括:对所述用户深度画像进行数据可视化分析,根据数据可视化分析结果评估训练后的所述表征学习模型的应用效果。
第二方面,本发明实施例提供了一种用户深度画像装置,所述用户深度画像装置包括原始数据处理模块、数据抽象模块、数据表征模型建立模块和画像获取模块。所述原始数据处理模块用于获取用户的原始数据,确定所述原始数据的数据类型。所述数据抽象模块用于根据所述数据类型,对所述原始数据进行抽象转化处理,获得抽象数据。所述数据表征模型建立模块用于确定与所述抽象数据的类型对应的表征学习神经网络,采用所述表征学习神经网络对所述抽象数据进行建模,获得数据表征模型。所述画像获取模块用于根据所述数据表征模型设计并训练所述表征学习模型的目标函数,并利用所述目标函数对所述用户进行深度画像,获得用户深度画像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京顶象技术有限公司,未经北京顶象技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810633410.8/2.html,转载请声明来源钻瓜专利网。