[发明专利]一种基于潜在狄利克雷分配模型的潜在特征提取方法在审
申请号: | 201710273587.7 | 申请日: | 2017-04-24 |
公开(公告)号: | CN107133730A | 公开(公告)日: | 2017-09-05 |
发明(设计)人: | 王宝亮;王宇琛 | 申请(专利权)人: | 天津大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q30/06;G06F17/27 |
代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于潜在狄利克雷分配模型的隐特征提取方法,包括选取一段时间内用户对商品的评分及对这些商品的标签,用户好友关系信息和用户的自身特性作为数据集;从数据集提取出不同用户对同一商品的标签置于同一商品下,并且按商品热度由零开始将数据集重新排列;为潜在狄利克雷分配模型向量赋初始值;针对一个特定商品的标签集合中的标签,得到其出现概率;得到其潜在特征;更新参数;利用Gibbs Sampling通过求解出主题分布和词分布的后验分布,完成一次迭代;重复执行迭代步骤,对每个标签按照Gibbs Sampling公式重新采样得到潜在特征,在标签库中更新,此收敛值即为潜在狄利克雷分配模型的最终输出值。 | ||
搜索关键词: | 一种 基于 潜在 狄利克雷 分配 模型 特征 提取 方法 | ||
【主权项】:
一种基于潜在狄利克雷分配模型的隐特征提取方法,包括下列步骤:(1)选取一段时间内用户对商品的评分,以及这些用户对这些商品的标签,用户好友关系信息和用户的自身特性作为数据集;(2)从数据集提取出不同用户对同一商品的标签置于同一商品下,并且按商品热度由零开始将数据集重新排列,重新定义商品ID;(3)随机地为潜在狄利克雷分配模型向量θd和赋初始值,参数θd的含义为标签集合中的每个标签集合d,对应不同潜在特征的概率θd<pt1,pt2,...pti,...pt25>,其中,pti表示d对应潜在特征集T中第i个潜在特征的概率,参数的含义为对每个潜在特征集T中的潜在特征t,生成不同标签的概率其中,pwi表示t第i个标签的概率;(4)针对一个特定商品的标签集合ds中的第i个标签wi,令该标签对应的潜在特征为tj,得到标签集合的中出现标签wi的概率;(5)枚举T中的潜在特征,得到所有的pj(wj|ds),即在标签集合ds中出现第j个标签wj的概率;然后可以根据这些概率值结果,取令pj(wi|ds)最大的tj为ds中的第i个标签wi为其潜在特征;(6)如果ds中的第i个标签wj此时选择了一个与原先不同的潜在特征,根据向量θd和的计算公式,会对θd和产生反馈,更新参数,迭代公式如下:θm,k=nm(k)+αkΣk-1Knm(k)+αk]]>然后将θd与带入Gibbs Sampling公式中,通过求解出主题分布和词分布的后验分布,从而成功解决主题分布和词分布这两参数未知的问题,完成一次迭代;其中,αk与βt分别为未知的主题分布超参数和词分布超参数,Gibbs Sampling;(7)重复执行(4)‑(6)步骤,对每个标签按照Gibbs Sampling公式重新采样得到潜在特征,在标签库中更新,直到Gibbs Sampling输出收敛,此收敛值即为潜在狄利克雷分配模型的最终输出值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710273587.7/,转载请声明来源钻瓜专利网。
- 上一篇:用于物流园区的车辆调度系统
- 下一篇:一种梯级泵站调水工程甩站优化调度方法
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理