[发明专利]一种对在线社交网络用户进行结构化属性推断的方法有效
申请号: | 201710296508.4 | 申请日: | 2017-04-28 |
公开(公告)号: | CN107145977B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 罗绪成;谢敏锐;解书颖 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G06N3/04;G06N5/04 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种对在线社交网络用户进行结构化属性推断的方法,将用户的多个属性编码为结构化的组合属性类别向量,通过在用户节点关系图G中进行权重化的随机游走获取用户节点序列集,然后利用词转向量工具Word2Vec生成每个用户节点的实数值向量表示;构建一个的全连接神经网络模型进行训练。在用户属性推断时,将需要推断属性的用户节点向量表示输入到训练好的神经网络模型中,计算得出每个组合属性类别向量的概率,取概率最大的为该用户的组合属性类别。本发明只需提取部分用户的属性信息以及用户间的好友关系(或关注关系),无需获取额外的用户行为特征数据;同时,所提出的方法充分利用属性之间内在联系,提高了属性推断的准确度。 | ||
搜索关键词: | 一种 在线 社交 网络 用户 进行 结构 属性 推断 方法 | ||
【主权项】:
一种对在线社交网络用户进行结构化属性推断的方法,其特征在于,包括以下步骤:(1)、确定在线社交网络根据需求,确定一个需要进行用户属性推断的在线社交网络(OSN),且该在线社交网络中用户的每个属性即用户属性Atti只有一个值,其中,i为用户属性编号;(2)、选取部分已知用户属性的用户,构建其0‑1组合属性类别向量2.1)、将用户属性规范为I个,对于用户的第i个属性Atti,统计其属性值个数Ni,并构建只有一个位置为1的、元素个数为Ni的0‑1形式向量:0‑1形式向量的每一位对应一个属性值,如果已知用户属性的用户,其第i个属性Atti属于某一个属性值,则0‑1形式向量中对应属性值位为1;2.2)、将已知用户属性用户的所有属性Atti对应的0‑1形式向量组合在一起,形成一个结构化属性向量;2.3)、构建一个映射表:映射表的索引为结构化属性向量所有可能的取值,映射值为只有一个位置为1的、元素个数为D的0‑1组合属性类别向量,D为结构化属性向量所有可能的取值数量,索引与映射值一一对应;已知用户属性用户的结构化属性向量,根据其取值,查找映射表,得到其对应的0‑1组合属性类别向量Vec_tk,其中,k为已知用户属性用户的编号,k=1,2,...,K,K为已知用户属性用户的数量;(3)、权重化随机游走,获取用户节点序列集WalkList将在线社交网络中用户间存在的好友关系表示为由代表用户的节点集V和代表用户间好友关系的边集E组成的无向图即用户节点关系图G;对用户节点关系图G中所有节点进行遍历,得到在线社交网络OSN的用户节点序列集WalkList:3.1)、对于在线社交网络OSN,初始化节点之间的权重为1;3.2)、第一趟遍历用户节点关系图G中的所有节点时,依次选择一个节点作为开始节点进行权重修改的随机游走,游走时从开始节点或到达节点的邻居节点中,选择一个邻居节点作为下一跳,同时修改并保存两节点之间的权重,权重修改方式如下:①若选择的邻居节点与上一节点相同,则以两个节点之间的权重乘以1/p的概率修改两节点之间的权重;②若选择的邻居节点与上一节点互为邻居节点,则两节点之间的权重不变;③若选择的邻居节点并无上述两种关系,则以两个节点之间的权重乘以1/q的概率修改两节点之间的权重,直到走过的节点形成一个长度L的节点序列;下一趟遍历时,某一节点在选择下一跳节点时,计算其所有邻居节点的权重之和wa,每个邻居节点被选为下一跳的概率为wj/wa,权重比越大的邻居节点被选中的概率越大,选中某一邻居节点后,按照权重修改方式修改两节点之间的权重并保存;其中,wj为所述节点与邻居节点之间的权重;每次遍历结束得到以不同节点作为起点的节点序列集,多趟循环遍历用户节点关系图G中的所有节点,得到多个节点序列集并组成用户节点序列集WalkList;(4)、获取S维空间的用户节点向量表示将用户节点序列集WalkList用词转向量工具Word2Vec进行转换,得到用户在S维空间(S一般取值范围在几十到几百之间)的向量表示,具体为:将用户节点序列集WalkList中的所有节点序列输入词转向量工具Word2Vec中,按照设置的窗口(window‑size)以及维度(dimensions=S)进行转换,得到各个用户xv(v∈V)在S维空间对应的向量Vec_xv;(5)、训练得到一个全连接神经网络模型构建一个全连接神经网络,将K个已知属性的用户的向量表示Vec_x1,Vec_x2,...,Vec_xK以及对应的0‑1组合属性类别向量Vec_t1,Vec_t2,...,Vec_tK作为训练集,放入全连接神经网络中进行训练,得到一个全连接神经网络模型;(6)、推断用户属性将需要推断用户属性的用户节点向量Vec_xu,输入到已经训练好的全连接神经网络模型中,通过各层网络计算,最终输出一个概率向量,概率向量中每一个位置对应一个0‑1组合属性类别向量取值,输出的概率向量中最大值的所在位置对应的0‑1组合属性类别向量取值即为该需要推断用户属性用户的结构化属性,根据步骤(2),可得到该用户的I个用户属性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710296508.4/,转载请声明来源钻瓜专利网。
- 上一篇:蓝牙转换器及蓝牙耳机
- 下一篇:一种便拆换式智能水表
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理