[发明专利]一种基于公共隐空间的异构网络排序方法无效
申请号: | 200910238290.2 | 申请日: | 2009-11-24 |
公开(公告)号: | CN101710338A | 公开(公告)日: | 2010-05-19 |
发明(设计)人: | 唐杰;王波;杨子 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N5/00 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 胡小永 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 公共 空间 网络 排序 方法 | ||
技术领域
本发明涉及一种网络排序技术,特别是指一种基于公共隐空间的异构网络排序方法。
背景技术
随着互联网的飞速发展以及Web1.0向Web2.0的转变,社会网络逐渐成为一项非常重要的Web应用。社会网络通常包含各种不同的对象,从而为我们提供了大量的异构数据源。例如,在顾客-产品-评价网络中,我们需要根据用户对产品的评价或打分预测用户的偏好。我们往往拥有大量的关于已有产品的评价信息,但是缺乏甚至没有新产品的打分数据。再例如,在社会网络中,我们拥有大量的可以用来为用户推荐电影的数据,但是却只有很有限的数据为用户推荐可能的好友(即与其爱好相似的用户)或者社团。因此一个基本的问题就是如何利用从已有的源域中的标号数据学到的知识为目标域中的未知数据建立准确可靠的排序模型。
对于异构网络中相互关联的实体进行排序的问题,一些相关研究已经展开:例如迁移学习方法、领域自适应方法、多任务学习方法以及排序学习方法。但是现有的方法都不能很好的处理异构网络中的以下问题:
1、由于异构网络排序问题中涉及到多种类型的实体(即异构对象),第一个需要解决的问题就是怎样去描述源域和目标域的相关性。
2、迁移排序:并不只是需要从源域中迁移知识到目标域,还需要在学到的排序模型中,保持源域中的排序关系。
3、效率:通常来讲,排序学习需要有上千(甚至上万)的训练数据,因此需要处理大规模的数据。
发明内容
针对现有技术中存在的缺陷和不足,本发明的目的是提供一种基于隐空间的异构网络排序装置和方法,能够在异构网络中进行排序。
为达到上述目的,本发明提出了一种基于公共隐空间的异构网络排序方法,包括:
步骤1、设定源域与目标域之间的公共隐空间,并将源域与目标域的训练样本通过转换函数映射到该公共隐空间内;
步骤2、设定通用目标函数;并通过公共隐空间对源域与目标域进行关联,并为源域和目标域上分别设定损失函数;
步骤3、优化损失函数并进行公共隐空间学习。
其中,所述步骤1具体为:
设定转换函数φ:所述转换函数将源域与目标域中的实例均映射到d′维的公共隐空间中。
其中,所述步骤2具体为:
步骤21、最小化如下的损失函数:
其中,是指示函数,即当π成立时函数值为1,否则为0;统计目标域中的错误排序对的数目;η是权衡经验损失项R和模型复杂性的惩罚项ε的参数;
步骤22、为异构网络排序问题,设定通用目标函数如下:
其中,Jφ(fS,fT)是对于异构网络排序模型复杂度的惩罚项;λ是调节经验损失和惩罚项的参数;C是为了控制两个域上样本数量的不平衡性的参数。
其中,所述步骤3具体为:
步骤31、设定fT是实例空间上的线性函数fT(x)=<wT,x>;
其中wT是通过训练数据学习到的参数,即特征的权重;<·>表示向量之间的内积;
步骤32、将fT(x)=<wT,x>替换损失函数得到:
步骤33、对目标域的损失函数采用排序支持向量机的铰链损失估算排序错误对的数目的上界,具体为:
对于每个查询(k=1,…,nT),给定一个不同排序等级的实例对以及该实例对对应的标号为则新实例表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910238290.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多组电流均匀输出的高频电源装置
- 下一篇:软质超薄多位转换器