[发明专利]一种基于聚类的陌生人社交用户匹配方法和系统有效
申请号: | 201811056510.5 | 申请日: | 2018-09-11 |
公开(公告)号: | CN109241202B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 陈俊华 | 申请(专利权)人: | 杭州飞弛网络科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06Q50/00 |
代理公司: | 杭州恒翌专利代理事务所(特殊普通合伙) 33298 | 代理人: | 柯奇君 |
地址: | 310001 浙江省杭州市滨江区滨安路1*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 陌生人 社交 用户 匹配 方法 系统 | ||
1.一种基于聚类的陌生人社交用户匹配方法,其特征在于,包括:
为每个注册用户建立一个用户画像,在用户画像当中保存每个用户的个人属性信息、用户兴趣和用户个性标签以及活动历史信息,所述个人属性信息包括用户注册时填写的性别和年龄信息,所述活动历史信息是该注册用户组织和参与过的以及有过点赞或关注行为的历史社交活动的活动历史记录;
将历史用户的用户画像的性别、年龄个人属性信息转化为对应的特征值;将用户兴趣标签转化为对应体育、美食、艺术类别的特征值,利用预设的个性标签词库对个性标签对应的类别进行识别,将用户个性标签当中可识别的个性标签按照预设的规则转化为所对应体育、美食、艺术类别的特征值;根据历史社交活动的类别以及用户发起、参与、点赞或关注活动的次数,将用户发起、参与、点赞或关注活动的活动历史信息转化为注册用户对应体育、美食、艺术类别的特征值,以及统计用户参与的历史社交活动的时间和同伴性别属性情况,分别转化为与每种活动属性对应的特征值;
基于历史用户的特征数据,将每个历史用户与一个多维特征向量对应;多维特征向量包括“用户年龄”、“用户性别”、“体育”、“美食”、“艺术”、“历史活动时间”、“历史活动性别情况”七个特征向量维度,每个特征向量维度对应有一个具体数值作为特征值;
对历史用户进行聚类,将历史用户划分为多个用户簇;
基于历史活动的特征数据,将每个历史活动与一个八维特征向量对应,八维特征向量包括“活动时间”、“活动地点”、“活动人数”、“活动人员平均年龄”、“活动人员性别比例”、“体育”、“美食”、“艺术”八个维度,每个特征向量维度对应有一个具体的特征值,基于历史活动的八维特征向量对历史活动进行聚类,将历史活动划分为多个活动簇;
将所述用户簇中的用户参与活动簇中的活动的占比最高的活动簇作为所述用户簇的匹配活动簇,确定所述用户簇和所述活动簇的对应关系;
分别对当前用户和当前活动进行划分,确定所述当前用户和所述当前活动分别所属的用户簇和活动簇;计算所述当前用户对应的特征向量与各用户簇的聚类中心的距离,并将所述当前用户划分为与聚类中心距离最小的用户簇;计算当前活动的特征向量与各活动簇的聚类中心的距离,并将所述当前活动划分为与聚类中心距离最小的活动簇;
基于所述用户簇和所述活动簇的对应关系,将与所述当前用户所属的用户簇对应的活动簇中的当前活动推送给所述当前用户;
其中,对于历史用户的特征向量和/或历史活动的特征向量,利用权重向量(α1,α2,α3,……,αk)对所述特征向量(x1,x2,x3,……,xk)进行修正,其中α1+α2+α3+……+αk=1,修正后的特征向量为(α1x1,α2x2,α3x3,……,αkxk),用于后续的聚类分析;权重向量α1,α2,α3,……,αk的取值根据为用户匹配社交活动时对各方面属性因素的侧重来调节权重向量中α1,α2,α3,……,αk的取值;
其中,所述基于历史用户的特征数据对历史用户进行聚类,将历史用户划分为多个用户簇,包括:根据历史用户的特征数据生成n个k维的特征向量作为样本点,其中n为历史用户的总量,k为历史用户的特征向量的维度数;给定s个中心点,分别计算每个样本点到s个中心点之间的距离,其中s小于或等于n;将每个样本点标记为与其距离最近的中心点相对应的类别;更新每个类别中的中心点为隶属该类别的所有样本点的均值;重复上述标记样本点类别和更新中心点的过程,直到所有样本点到其隶属的中心点之间的距离和最小,生成多个用户簇;
其中,基于历史活动的八维特征向量对历史活动进行聚类,将历史活动划分为多个活动簇,包括:根据历史活动的特征数据生成m个g维的特征向量作为样本点,其中m为历史活动的总量,g为历史活动的特征数据的维度数;给定q个中心点,分别计算每个样本点到q个中心点之间的距离,其中q小于或等于m;将每个样本点标记为与其距离最近的中心点相对应的类别;更新每个类别中的中心点为隶属该类别的所有样本的均值;重复上述标记样本点类别和更新中心点的过程,直到所有样本点到其隶属的中心点之间的距离和最小,生成多个活动簇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州飞弛网络科技有限公司,未经杭州飞弛网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811056510.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于电化学发光法检测古代毛织品的方法
- 下一篇:一种废纸再生工艺方法