[发明专利]一种基于LDA主题模型的电信用户相似度发现方法有效
申请号: | 201710756540.6 | 申请日: | 2017-08-29 |
公开(公告)号: | CN107613520B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 解绍词;吴新凯;徐光侠;刘宴兵;程金伟 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06Q50/30 | 分类号: | G06Q50/30;H04L12/24 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 李金蓉 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及数据挖掘领域,具体公开了一种基于LDA(Latent Dirichlet Allocation潜在狄利克雷分布)主题模型的电信用户相似度发现方法,其是将电信用户的多维特征与基于概率模型的主题发现算法有机地联系在一起,从四个不同的方面考虑电信用户相似度计算方法,这四个方面分别是:用户的基本属性、通话记录、短信记录以及用户一天中连接的所有基站的位置信息和连接起始时间、结束时间。本发明重点利用LDA主题模型对用户一天中所连基站信息语料库进行建模,利用文本的统计特性,挖掘隐藏在文本内的潜在主题信息,得到文档的主题分布,以此计算文档的相似度,为深入挖掘电信领域用户的相似特征提供有力地保证。 | ||
搜索关键词: | 一种 基于 lda 主题 模型 电信用户 相似 发现 方法 | ||
【主权项】:
一种基于LDA主题模型的电信用户相似度发现方法,其特征在于,包括以下步骤:S1:采集用户信息;S2:对S1中采集的用户信息进行预处理;S3:对S2中预处理信息中的基本属性、用户通话记录和用户短信记录分别进行相似度计算;S4:对S2中预处理信息中的用户在一天内所连基站位置信息,建立LDA模型,计算该信息相似度;S5:综合S3和S4的相识度计算,推测相互关系;S6:以S5中推测出的相互关系进行聚类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710756540.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种双工位自动切割机
- 下一篇:一种45度切割机