[发明专利]面向捐赠众筹领域的推荐方法在审
申请号: | 202010022643.1 | 申请日: | 2020-01-09 |
公开(公告)号: | CN111259236A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 李少波;宋辉;胡甜甜;蒋涛涛;张安思 | 申请(专利权)人: | 贵州大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/951 |
代理公司: | 贵阳中新专利商标事务所 52100 | 代理人: | 刘艳 |
地址: | 550025 贵州省贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 捐赠 领域 推荐 方法 | ||
本发明公开了一种面向捐赠众筹领域的推荐方法,其特征在于:包含以下以下步骤:步骤1:通过网络爬虫,获取数据源,并进行本地存储;步骤2:对获取的数据进行数据预处理,形成规范数据;步骤3:用户意向捐赠众筹数据关联:通过自然语言的方法构建一个捐赠众筹知识库;基于实体的信息抽取技术对用户文本内容进行信息提取;其次,将提取的用户信息和公益信息关联关系存储到知识库中;最后,在知识库上进行知识检索和推理完成两种捐赠意向关联关系的分析;步骤4:基于知识库,构建用户捐赠众筹的推荐方法:根据建立的捐赠众筹关联关系,运用协同过滤算法计算有意向捐赠者之间的意向捐赠程度,建立意向捐赠程度矩阵其中Sim(Vp,Vq)表示有意向捐赠的明星之间的意向捐赠程度,Vp与Vn表示的是用户与商品,rvp与rvq分别是两个用户的矩阵。
技术领域
本发明涉及一种基于网络捐赠众筹信息推荐系统方法,本文采用了数据挖掘、自然语言处理以及推荐系统的方法相结合。
背景技术
随着互联网的发展,互联网数据特征日益凸显,其数据量增长异常迅猛,数据类型多样、数据质量良莠不齐并且关联关系复杂。同时,互联网大数据另外一个突出的特点就是其价值密度低,大数据中包含了大量重复、噪声和垃圾数据,存在大量共现但又毫无意义的关联模式。数据庞大的规模、复杂的关联关系,使得传统的文本分析和挖掘技术在计算的时空复杂度上激增;另外,迅猛的数据增长速率、巨大的数据体量也使得传统的全量计算模式不再适用。互联网大数据复杂的内在特征使得信息提取变得十分困难。当今推荐系统主要根据用户的相似特征以及浏览数据等情况为用户推荐感兴趣的内容。而众筹信息的种类比较多,且推荐范围比较广,对于用户没有一个相似特征或浏览记录,用户出现冷启动要进行精准的信息推送是当前比较困难的问题。
发明内容
本发明的目的在于解决捐赠项目的冷启动问题以及对现在推荐结果效果不好,提供了一种基于文本挖掘的捐赠信息推荐方法,达到了为用户推荐捐赠或者众筹项目信息的目的;本方案通过爬虫获取明星用户的数据,通过对数据进行预处理得到规范的文本;然后构建意向捐赠众筹数据关联;最后通过协同过滤算法进行推荐。
本发明的技术方案是:为解决上述的问题,本发明采用协同过滤算法思想,找用户的相似特征以及捐赠记录等数据,首先是通过爬虫获取用户的数据,然后采用文本挖掘技术挖掘意向捐赠众筹的数据,并且进行关联。通过自然语言处理的方法构建知识库进行知识的检索与推理;最后根据协同过滤算法计算相似度,实现捐赠众筹信息的推荐。
一种面向捐赠众筹领域的推荐方法,包含以下以下步骤:步骤1:通过网络爬虫,获取数据源,并进行本地存储;步骤2:对获取的数据进行数据预处理,形成规范数据;步骤3:用户意向捐赠众筹数据关联:通过自然语言的方法构建一个捐赠众筹知识库;基于实体的信息抽取技术对用户文本内容进行信息提取;其次,将提取的用户信息和公益信息关联关系存储到知识库中;最后,在知识库上进行知识检索和推理完成两种捐赠意向关联关系的分析;步骤4:基于知识库,构建用户捐赠众筹的推荐方法:根据建立的捐赠众筹关联关系,运用协同过滤算法计算有意向捐赠者之间的意向捐赠程度,建立意向捐赠程度矩阵
其中Sim(Vp,Vq)表示有意向捐赠的明星之间的意向捐赠程度,Vp与Vn表示的是用户与商品,rvp与rvq分别是两个用户的矩阵。
所述的步骤1中获得的数据源为用户的公益信息,所述的公益信息包含公益名称、捐赠众筹情况、公益地点、合作机构和评论。
所述的步骤2中的数据预处理为数据清洗、去冗余、去噪、过滤操作,获得规范化的文本数据。
本发明的有益效果:基于文本挖掘的捐赠众筹的推荐方法,将项目分为四步:数据获取、数据清洗、候选捐赠众筹关联关系、构建推荐算法。最后通过有效的推荐,将捐赠众筹信息推荐给感兴趣的明星用户,会极大的提高推荐用户感兴趣的程度。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州大学,未经贵州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010022643.1/2.html,转载请声明来源钻瓜专利网。