[发明专利]一种基于社交数据的信息处理方法和装置在审
申请号: | 201710637962.1 | 申请日: | 2017-07-31 |
公开(公告)号: | CN107480217A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 李哲君;卫华飞;杨勋 | 申请(专利权)人: | 陕西识代运筹信息科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06Q50/00 |
代理公司: | 北京众达德权知识产权代理有限公司11570 | 代理人: | 刘杰 |
地址: | 710065 陕西省西安市*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社交 数据 信息处理 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于社交数据的信息处理方法和装置。
背景技术
社交网络日益丰富着人们的日常生活,人们越来越习惯于通过网络来表达自己,越来越倾向于在网络中扩大自己的影响,通过关注自己感兴趣的好友、明星或者话题,参与活动,彼此之间形成互动,这也间接造就了各个社交网络特有的复杂图谱关系网络。
但本申请发明人在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
现有技术中由于各个社交网络关注关系形成了复杂的图谱关系,导致无法对繁杂的兴趣标标签进行归类,从而不能对大量用户的兴趣特点进行多维度聚类分析的技术问题。
发明内容
本发明实施例提供了一种基于社交数据的信息处理方法和装置,解决了现有技术中由于无法对繁杂的兴趣标标签进行归类,从而不能对大量用户的兴趣特点进行多维度聚类分析的技术问题。
鉴于上述问题,提出了本申请实施例以便提供一种基于社交数据的信息处理方法和装置。
第一方面,本发明提供了一种基于社交数据的信息处理方法,所述方法包括:获得N个用户数据;根据所述N个用户数据确定所述N个用户数据的M个兴趣参数;根据所述N个用户数据和M个兴趣参数,确定所述N个用户数据中的第P个用户的兴趣参数值;根据所述兴趣参数值确定第Q个用户;将所述第Q个用户列入第一目标用户组,其中,所述M、N、P均为正整数,且所述N大于等于P。
优选的,所述根据所述兴趣参数值确定Q个用户,还包括:获得第一目标用户组的阈值;判断所述第P个用户的所述兴趣参数值是否满足所述阈值;如满足所述阈值,则确定为第Q个用户。
优选的,所述确定所述N个用户数据中的第P个用户的兴趣参数值,还包括:步骤1:获得K个用户为族中心;步骤2:将所述N个用户数据中的任一个数据分配到距离所述K个用户中最近的一个,获得K个族;步骤3:获得所述K个族中的距离均值,并确定与所述距离均值相同的用户为新的族中心;步骤4:重复上述步骤2和步骤3,直到所述K个族的中心位置确定。
优选的,所述方法还包括:在所述K个族的中心位置确定之后,确定所述K个族的用户。
优选的,所述根据所述N个用户数据确定所述N个用户数据的M个兴趣参数,还包括:根据所述N个用户,确定M个种子用户,所述种子用户具有兴趣参数;根据所述M个种子用户,确定所述M个兴趣参数。
第二方面,本发明提供了一种基于社交数据的信息处理装置,所述装置包括:
第一获得单元,所述第一获得单元用于获得N个用户数据;
第一确定单元,所述第一确定单元用于根据所述N个用户数据确定所述N个用户数据的M个兴趣参数;
第二确定单元,所述第二确定单元用于根据所述N个用户数据和M个兴趣参数,确定所述N个用户数据中的第P个用户的兴趣参数值;
第三确定单元,所述第三确定单元用于根据所述兴趣参数值确定第Q个用户;
第四确定单元,所述第四确定单元用于将所述第Q个用户列入第一目标用户组,其中,所述M、N、P均为正整数,且所述N大于等于P。
优选的,所述根据所述兴趣参数值确定Q个用户,还包括:
第二获得单元,所述第二获得单元用于获得第一目标用户组的阈值;
第一判断单元,所述第一判断单元用于判断所述第P个用户的所述兴趣参数值是否满足所述阈值;
第五确定单元,所述第五确定单元用于如满足所述阈值,则确定为第Q个用户。
优选的,所述确定所述N个用户数据中的第P个用户的兴趣参数值,还包括:
第三获得单元,所述第三获得单元用于获得K个用户为族中心;
第四获得单元,所述第四获得单元用于将所述N个用户数据中的任一个数据分配到距离所述K个用户中最近的一个,获得K个族;
第五获得单元,所述第五获得单元用于获得所述K个族中的距离均值,并确定与所述距离均值相同的用户为新的族中心;
第六确定单元,所述第六确定单元用于重复上述步骤2和步骤3,直到所述K个族的中心位置确定。
进一步的,所述方法还包括:
第七确定单元,所述第七确定单元用于在所述K个族的中心位置确定之后,确定所述K个族的用户。
进一步的,所述根据所述N个用户数据确定所述N个用户数据的M个兴趣参数,还包括:
第八确定单元,所述第八确定单元用于根据所述N个用户,确定M个种子用户,所述种子用户具有兴趣参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西识代运筹信息科技股份有限公司,未经陕西识代运筹信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710637962.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置