[发明专利]一种基于潜在狄利克雷分配模型的潜在特征提取方法在审

专利信息
申请号: 201710273587.7 申请日: 2017-04-24
公开(公告)号: CN107133730A 公开(公告)日: 2017-09-05
发明(设计)人: 王宝亮;王宇琛 申请(专利权)人: 天津大学
主分类号: G06Q10/06 分类号: G06Q10/06;G06Q30/06;G06F17/27
代理公司: 天津市北洋有限责任专利代理事务所12201 代理人: 程毓英
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于潜在狄利克雷分配模型的隐特征提取方法,包括选取一段时间内用户对商品的评分及对这些商品的标签,用户好友关系信息和用户的自身特性作为数据集;从数据集提取出不同用户对同一商品的标签置于同一商品下,并且按商品热度由零开始将数据集重新排列;为潜在狄利克雷分配模型向量赋初始值;针对一个特定商品的标签集合中的标签,得到其出现概率;得到其潜在特征;更新参数;利用Gibbs Sampling通过求解出主题分布和词分布的后验分布,完成一次迭代;重复执行迭代步骤,对每个标签按照Gibbs Sampling公式重新采样得到潜在特征,在标签库中更新,此收敛值即为潜在狄利克雷分配模型的最终输出值。
搜索关键词: 一种 基于 潜在 狄利克雷 分配 模型 特征 提取 方法
【主权项】:
一种基于潜在狄利克雷分配模型的隐特征提取方法,包括下列步骤:(1)选取一段时间内用户对商品的评分,以及这些用户对这些商品的标签,用户好友关系信息和用户的自身特性作为数据集;(2)从数据集提取出不同用户对同一商品的标签置于同一商品下,并且按商品热度由零开始将数据集重新排列,重新定义商品ID;(3)随机地为潜在狄利克雷分配模型向量θd和赋初始值,参数θd的含义为标签集合中的每个标签集合d,对应不同潜在特征的概率θd<pt1,pt2,...pti,...pt25>,其中,pti表示d对应潜在特征集T中第i个潜在特征的概率,参数的含义为对每个潜在特征集T中的潜在特征t,生成不同标签的概率其中,pwi表示t第i个标签的概率;(4)针对一个特定商品的标签集合ds中的第i个标签wi,令该标签对应的潜在特征为tj,得到标签集合的中出现标签wi的概率;(5)枚举T中的潜在特征,得到所有的pj(wj|ds),即在标签集合ds中出现第j个标签wj的概率;然后可以根据这些概率值结果,取令pj(wi|ds)最大的tj为ds中的第i个标签wi为其潜在特征;(6)如果ds中的第i个标签wj此时选择了一个与原先不同的潜在特征,根据向量θd和的计算公式,会对θd和产生反馈,更新参数,迭代公式如下:θm,k=nm(k)+αkΣk-1Knm(k)+αk]]>然后将θd与带入Gibbs Sampling公式中,通过求解出主题分布和词分布的后验分布,从而成功解决主题分布和词分布这两参数未知的问题,完成一次迭代;其中,αk与βt分别为未知的主题分布超参数和词分布超参数,Gibbs Sampling;(7)重复执行(4)‑(6)步骤,对每个标签按照Gibbs Sampling公式重新采样得到潜在特征,在标签库中更新,直到Gibbs Sampling输出收敛,此收敛值即为潜在狄利克雷分配模型的最终输出值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710273587.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top