[发明专利]一种获取推荐信息的方法、装置及计算机可读存储介质有效
申请号: | 201810162256.0 | 申请日: | 2018-02-26 |
公开(公告)号: | CN110196904B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 陈必东;杜放 | 申请(专利权)人: | 佛山市顺德区美的电热电器制造有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/289;G06F40/216;G06F16/35;G06N5/025 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 蒋雅洁;张颖玲 |
地址: | 528311 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 推荐 信息 方法 装置 计算机 可读 存储 介质 | ||
本发明实施例公开了一种获取推荐信息的方法,该方法包括:获取N个用户针对终端的历史操作数据,得出N个用户中每个用户的特征模型数据,其包括:N个用户的词袋模型、N个用户中每个用户的词袋模型与N个用户中其他用户的词袋模型的相似度;对N个用户的词袋模型进行数据挖掘,得到N个用户中每个用户的频繁项集和初始关联规则;当i取1至N时,根据N个用户中第i个用户的特征模型数据对初始关联规则进行筛选,得到N个用户中第i个用户的筛选后的关联规则;根据N个用户中第i个用户的筛选后的关联规则,得到推荐信息;该方法根据用户的特征模型数据得到关联规则,将其作为获取推荐信息的依据,得到的推荐信息更加全面和符合该用户的个性特征。
技术领域
本发明涉及信息处理技术领域/人工智能领域,尤其涉及一种获取推荐信息的方法、装置及计算机可读存储介质。
背景技术
随着云时代的来临,大数据也吸引了越来越多的关注,大数据的特色就在于对海量数据进行分布式数据挖掘,其依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术,使这些原本看起来很难收集和使用的海量数据开始容易被利用起来了,通过各行各业的不断创新,大数据正在逐步为人类创造更多的价值。
目前用户对移动终端的使用已经十分的普遍,用户的很多日常活动都在移动终端上完成,例如购买商品、餐饮消费、发表评论、浏览感兴趣的信息等等,这些庞大的数据信息现在很容易被采集和掌握,而对这些含有意义的数据进行专业化处理,是那些为消费者提供产品或服务的企业利用大数据进行精准营销的关键所在。在这种需求的牵引下,数据挖掘技术因此而诞生并成为新的技术热点,数据挖掘可以被描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。数据挖掘的一种主要形式就是规则挖掘,即如果一个事务中含有X,则该事务中很可能含有Y,具体形式为X→Y,这就是关联规则,具体挖掘关联规则的过程描述如下:
设:I={i1,i2,…,im}是所有项目的集合,D是所有事务的集合(即数据库),每个事务T是一些项目的集合,T包含在I中,每个事务可以用唯一的标识符TID来标识;设X为某些项目的集合,如果X包含在T中,则称事务T包含X,关联规则则表示为如下形式:(X包含在T)→(Y包含在T)的蕴涵式,其中,X、Y均为I的子集,且X与Y的交集为空;其意义在于一个事务中某些项目的出现,可推导出另一些项目在同一事务中也出现,简单的表示为:X→Y,其中,‘→’称为‘关联’操作,X称为关联规则的先导,Y称为关联规则的后继。
数据库D中的关联规则X→Y是由支持度s(support)和置信度c(confidence)约束,置信度表示规则的强度,支持度表示规则出现的频度。数据项集X的支持度s(X)是D中包含X的事务数量与D的总事务数量之比,为了便于计算,将数据项集X的支持度用数据库D中包含X的事务数量来表示,那么这条关联规则的支持度s和置信度c分别表示为:支持度s=支持度(X∪Y)=事务数量(X∪Y)、置信度c=支持度(X∪Y)/支持度(X)。最小支持度阈值(minsupport)表示数据项集在统计意义上的最低主要性,最小置信度阈值(minconfidence)表示规则的最低可靠性,如果数据项集X的支持度大于最小支持度,则称X为频繁项集,如果关联规则的置信度和支持度分别大于最小支持度阈值和最小置信度阈值,则称该关联规则为强关联规则。
关联规则的挖掘主要分为两个步骤:(1)通过递归的方法,找出事务数据库D中所有大于等于最小支持度阈值的频繁项集;(2)利用频繁项集生成所需要的关联规则,例如,频繁项集A的非空子集a也是频繁项集,如果比率support(A)/support(a)≥minconfidence,就生成关联规则a→(A-a),比率support(A)/support(a)为该关联规则的置信度。现有技术中通常读取数据库中所有用户的终端数据,采用Apriori算法得到频繁项集,然后由频繁项集得到关联规则,根据关联规则向每个用户推荐符合其个人喜好特征的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山市顺德区美的电热电器制造有限公司,未经佛山市顺德区美的电热电器制造有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810162256.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置