[发明专利]一种对在线社交网络用户进行结构化属性推断的方法有效
申请号: | 201710296508.4 | 申请日: | 2017-04-28 |
公开(公告)号: | CN107145977B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 罗绪成;谢敏锐;解书颖 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G06N3/04;G06N5/04 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 在线 社交 网络 用户 进行 结构 属性 推断 方法 | ||
本发明公开了一种对在线社交网络用户进行结构化属性推断的方法,将用户的多个属性编码为结构化的组合属性类别向量,通过在用户节点关系图G中进行权重化的随机游走获取用户节点序列集,然后利用词转向量工具Word2Vec生成每个用户节点的实数值向量表示;构建一个的全连接神经网络模型进行训练。在用户属性推断时,将需要推断属性的用户节点向量表示输入到训练好的神经网络模型中,计算得出每个组合属性类别向量的概率,取概率最大的为该用户的组合属性类别。本发明只需提取部分用户的属性信息以及用户间的好友关系(或关注关系),无需获取额外的用户行为特征数据;同时,所提出的方法充分利用属性之间内在联系,提高了属性推断的准确度。
技术领域
本发明属于网络信息技术领域,更为具体地讲,涉及一种对在线社交网络用户进行结构化属性推断的方法。
背景技术
属性推断是用来自动预测在线社交网络中用户的未知属性和潜在特质的主要技术手段,可应用于市场分析中定义不同的客户类型,深度挖掘用户属性信息以优化个性化的推荐方法,同时针对可能的用户属性推断攻击采取相应的保护措施。如推测用户的年龄、性别、地理位置、兴趣、职业等,这些信息可用于商品推荐、资讯推荐。
已有属性推断方法提取的特征包括用户本身的个人信息如性别、年龄、职业、教育水平,以及用户的行为信息如浏览的网页、共享的位置、购买的商品数据等。然而由于涉及个人隐私,提取的用户个人信息往往存在不真实不全面的问题;用户行为信息(特征数据)大多数也不容易获取,且需耗费大量的时间和资源。
此外,已有属性推断采取多个属性分别预测的方法,忽视了属性之间本身存在的相关性质,因此已有属性推断方法效率低且准确性不高。同时,已有属性推断方法的思路是利用用户的行为特征相似,进而推断用户属性存在相同的趋势,通过提取用户行为特征进行用户建模,从而设计算法进行单个属性推断。尽管已有属性推断方法完成了属性推断的任务,但其所需的输入信息较多,且难以避免不真实的用户信息对属性推断结果的影响,故而属性推断的可移植性不高。
发明内容
本发明的目的在于克服现有属性推断的不足,提出一种对在线社交网络用户进行结构化属性推断的方法,以提高属性推断的效率和准确性,并避免不真实的用户信息对属性推断结果的影响,改善属性推断的可移植性。
为实现上述发明目的,本发明对在线社交网络用户进行结构化属性推断的方法,其特征在于,包括以下步骤:
(1)、确定在线社交网络
根据需求,确定一个需要进行用户属性推断的在线社交网络(OSN),且该在线社交网络中用户的每个属性即用户属性Atti只有一个值,其中,i为用户属性编号;
(2)、选取部分已知用户属性的用户,构建其0-1组合属性类别向量
2.1)、将用户属性规范为I个,对于用户的第i个属性Atti,统计其属性值个数Ni,并构建只有一个位置为1的、元素个数为Ni的0-1形式向量:0-1形式向量的每一位对应一个属性值,如果已知用户属性的用户,其第i个属性Atti属于某一个属性值,则0-1形式向量中对应属性值位为1;
2.2)、将已知用户属性用户的所有属性Atti对应的0-1形式向量组合在一起,形成一个结构化属性向量;
2.3)、构建一个映射表:映射表的索引为结构化属性向量所有可能的取值,映射值为只有一个位置为1的、元素个数为D的0-1组合属性类别向量,D为结构化属性向量所有可能的取值数量,索引与映射值一一对应;
已知用户属性用户的结构化属性向量根据其取值,查找映射表,得到其对应的0-1组合属性类别向量Vec_tk,其中,k为已知用户属性用户的编号,k=1,2,...,K,K为已知用户属性用户的数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710296508.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:蓝牙转换器及蓝牙耳机
- 下一篇:一种便拆换式智能水表
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理