[发明专利]一种基于关联规则与贝叶斯网络集成的推荐技术在审
申请号: | 201610096873.6 | 申请日: | 2016-02-23 |
公开(公告)号: | CN107103000A | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 肖建军 | 申请(专利权)人: | 广州启法信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510665 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关联 规则 贝叶斯 网络 集成 推荐 技术 | ||
技术领域
本发明涉及商务类网站的智能推荐技术领域,具体涉及将关联规则与贝叶斯网络集成的推荐算法。
背景技术
互联网和信息技术快速发展使得商务网站交易越来越频繁,大量的信息聚集起来形成海量信息。帮助用户从海量信息中快速准确地寻找到自己感兴趣的信息,建立一个有效的推荐系统,可以使商务网站建立稳定的企业忠实顾客群,提高用户满意度。
关联规则由于形式很简单,应用方便,得到快速的发展。关联规则可用于发现商务网站交易数据库中不同项目之间的联系,这些规则反映了用户的网站浏览模式。发现这些规则可以应用向用户推荐感兴趣的网址。自从关联规则提出以来,已成为主流的推荐技术。但是关联规则不能表达不同规则之间的联系,这极大地限制了关联规则在复杂情形下的应用。而贝叶斯网络用图形化的形式表示了如何将与一系列节点相关的条件概率函数组合成为一个整体的联合概率分布函数。一个贝叶斯网络包括了一个结构模型和与之相关的一组条件概率分布函数。结构模型是一个有向无环图,其中的节点表示了随机变量,它是对于过程、事件、状态等实体的某特性的描述,边则表示变量间的概率依赖关系。图中的每个节点都有一个在给定其父节点情况下该节点的条件概率分布函数。
由于贝叶斯网是变量的联合概率的表示,所以在对节点状态进行推理的过程中,能够综合考虑各个因素(父节点)的影响,由于关联规则和贝叶斯网络都是以概率论为理论基础的,可以考虑使用贝叶斯网络修正关联规则,并通过概率推论的方式预测当前用户访问对未曾浏览网址的概率,将得到的结果排序,推荐概率top-N的网址。
本发明根据用户历史浏览信息,发现商务网站交易数据库中不同项目之间的联系,将这些反映了用户的网站浏览模式的规则用有向无环图表达出来,基于贝叶斯网络预测当前用户访问各网址的条件概率,找出条件概率最大的N个网址推荐给用户。为用户提供个性化的服务的同时建立网站与用户之间的密切关系,让用户对推荐系统产生依赖,从而建立稳定的企业忠实顾客群,实现客户链式反应增值,提高消费者满意度。通过提高服务效率帮助消费者节约交易成本等,制定有针对性的营销战略方针,促进企业长期稳定高速发展。
发明内容
本发明针对商务网站的智能推荐技术,在关联规则的基础上学习贝叶斯网络结构,提出将关联规则与贝叶斯网络集成的推荐算法。
方法包括以下步骤:首先,对网址进行关联分析,并将关联规则按提升度排序。然后,依据关联规则前后件的关系,将关联规则转化成初始贝叶斯网络。再然后对初始贝叶斯网络进行结构学习,寻找最优贝叶斯网络结构,并学习最优贝叶斯网络结构的参数,此时的最优贝叶斯网络相当于对关联规则的修正。最后使用贝叶斯方法预测当前用户访问未知网址的概率,将概率最大的N个网址推荐给用户。
所述的将关联规则与贝叶斯网络集成,是对原始事务集使用Apriori算法得到关联规则,按提升度排序后,将其转化成贝叶斯网络结构。贝叶斯网的结构是一个有向无环图,图中的每一个节点唯一地对应一个随机变量,节点的状态对应于随机变量的值。图中的有向边表示变量(节点)之间的条件(因果)依赖关系。关联规则的前件和后件间也蕴含着一种依赖关系,转化的思路就是将关联规则中的这种依赖关系用贝叶斯网的结构表示出来。
所述的贝叶斯预测,将所有网址是否被访问看成一组随机向量变量,当前用户的历史访问记录就是一个样本,结合这个样本数据和参数先验,预测某个网址被访问的概率。变量包含贝叶斯网络节点和非贝叶斯网络节点两部分,假设贝叶斯网络节点条件独立,非贝叶斯网络节点相互独立,贝叶斯网络节点和非贝叶斯网络节点相互独立。
所述的关联规则与贝叶斯网络集成的推荐算法具体步骤如下:
1)数据预处理。在对原始数据的探索分析的基础上,发现与分析目标无关或模型需要处理的数据,针对此类数据进行处理。通过数据清洗、数据集成和数据变换,将原始数据处理成模型需要的输入数据。其中 为用户集,为网址集。
2)关联规则。首先将数据集D转化成事务集DT, 考虑到要与贝叶斯网络对应,本发明只分析具有单个后件属性状态的关联规则前件更新问题,因此Apriori算法只需检索出事务数据库中的所有2项频繁项集,利用频繁项集构造出满足用户最小提升度的规则,并根据提升度将规则按从大到小的顺序排列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州启法信息科技有限公司,未经广州启法信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610096873.6/2.html,转载请声明来源钻瓜专利网。