[发明专利]一种旅行社用户多维信息画像的构建方法有效
申请号: | 201811154032.1 | 申请日: | 2018-09-30 |
公开(公告)号: | CN109408712B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 刘德彬;陈玮;黄远江;刘建涛 | 申请(专利权)人: | 重庆誉存大数据科技有限公司;罗灿 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06;G06Q50/14;G06K9/62 |
代理公司: | 重庆智慧之源知识产权代理事务所(普通合伙) 50234 | 代理人: | 余洪 |
地址: | 401121 重庆市渝北*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 旅行社 用户 多维 信息 画像 构建 方法 | ||
本发明公开了一种旅行社用户多维信息画像的构建方法,包括如下步骤:获取样本用户的特征向量和用户画像信息;为样本用户每个标签分配权重;设置需要聚类的簇的个数k和相似度阈值θ;根据样本用户的标签向量,分别计算每两个样本用户之间的相似度;计算邻居矩阵A;计算链接矩阵;计算每两个样本用户的相似性度量,将相似性度量最高的两个样本用户合并;利用目标函数以获得最优的聚类结果;重复迭代,直至形成k个簇;为用户画像群划分等级。本发明利用利用聚类算法构建旅行社用户画像,并将其进行群分,有利于整理用户之间的共性,以便于更加了解用户需求,进而拓展新用户,确定旅游产品的模式。
技术领域
本发明属于数据处理技术领域,具体涉及一种旅行社用户多维信息画像的构建方法。
背景技术
随着大数据技术的发展与应用,越来越多企业和政府机构对精准定位某个人的特征的需求越来越大,在大数据项目整合的过程中最重要的就是针对不同类人的不同需求进行精准营销和个性化解决方案。一方面用户需要从大量的产品信息中筛选出自己感兴趣的产品;另一方面企业需要通过产品的特征参数的修改精准地推销出合适的产品给合适的用户。目前常用的推荐算法有:基于内容的推荐、基于用户行为的推荐、基于混合模型的推荐、基于标签的推荐等几种;对于产品量比较少,用户量较多,需要进行精准匹配的运营模式中,这些常用的推荐方法就不是很实用。
发明内容
为了解决现有技术存在的上述问题,本发明目的在于提供一种旅行社用户多维信息画像的构建方法,利用该用户画像,有利于整理用户之间的共性,为旅行社产品推荐提供数据基础。
本发明所采用的技术方案为:
一种旅行社用户多维信息画像的构建方法,包括如下步骤:
S101、获取样本用户原始数据,根据该原始数据对样本用户的特征和标签进行分析和提取,获得样本用户的特征向量和用户画像信息;
S102、为样本用户每个标签分配权重;
S103、设置需要聚类的簇的个数k和相似度阈值θ;
S104、根据样本用户的标签向量,分别计算每两个样本用户之间的相似度,生成相似度矩阵;
S105、根据相似度矩阵和相似度阈值θ,计算邻居矩阵A;若两个样本用户之间的相似度=θ,则该两个样本用户之间互为邻居,取值1,否则,该两个样本用户之间不互为邻居,取值0;
S106、根据每两个样本用户之间的共同邻居数量计算链接矩阵;
S107、根据链接矩阵和样本用户的标签向量,计算每两个样本用户的相似性度量,将相似性度量最高的两个样本用户合并;
S108、利用目标函数以获得最优的聚类结果;
S109、重复步骤S105~S108进行迭代,直至形成k个簇;
S110、利用标签的平均值,为用户画像群划分等级。
进一步,所述样本用户原始数据包括样本用户基本信息和样本用户旅游行为信息。
更进一步,所述步骤S102中,采用布尔模型S-TFIWF对用户标签进行加权处理,得到用户标签权重的S-TW模型,具体计算如下:
其中,TW(w,d)为标签w是否出现,出现为1,否则为0;N表示用户数量,WT(w)表示用户中出现该标签的数量之和,P表示所有用户消费总金额,T表示某个标签的用户群的消费总金额,T/P表示某个标签的用户群的消费总金额与所有用户消费总金额之比。
更进一步,所述步骤S104中,采用修正余弦相似度算法计算样本用户之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆誉存大数据科技有限公司;罗灿,未经重庆誉存大数据科技有限公司;罗灿许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811154032.1/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置