[发明专利]一种基于用户反馈数据流的实时个性化推荐方法及系统在审
申请号: | 201710709794.2 | 申请日: | 2017-08-18 |
公开(公告)号: | CN107480270A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 郝小汉;胡加明;张力超;陈磊 | 申请(专利权)人: | 北京点易通科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100102 北京市朝阳区利*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 反馈 数据流 实时 个性化 推荐 方法 系统 | ||
技术领域
本发明涉及学习个性化推荐方法,具体地说,是一种基于用户反馈数据流的实时个性化推荐方法及系统。
背景技术
在大数据的社会背景下,所谓个性化推荐就是根据用户的兴趣特点和行为,向用户推荐感兴趣的信息和内容。在当前,随着信息规模的不断扩大,内容数量和种类快速增长,需要花费大量的时间才能找到自己想买的内容,出现了所谓的信息超载问题。为了解决这个难题,个性化推荐系统应运而生。个性化推荐系统通过分析用户的行为,发现用户的个性化需求、兴趣等,然后将用户感兴趣的信息、产品推荐给用户。推荐系统主要依赖于数据挖掘和匹配算法。
以Google、百度为代表的搜索引擎可以让用户通过输入关键词精确找到自己需要的相关信息。但是,如果用户无法准确描述自己需求的关键词,此时搜索引擎就无能为力了。和搜索引擎不同,推荐系统不需要用户提供明确的需求,而是通过分析用户的历史行为来对用户的兴趣进行建模,从而主动给用户推荐可满足他们兴趣和需求的信息。因此,完美的推荐系统应该是一种强健的搜索引擎。
推荐系统现已广泛应用于很多领域,其中最典型并具有良好的发展应用前景的领域就是电子商务领域,如京东商城、天猫商城、亚马逊购物网站等等。
当前,大多数个性化推荐采用用户数据挖掘即日志抽取解析和数据清洗,训练,匹配算法,实现个性化推荐。
本发明专利,结合当前国内教育现代化现状,分析用户反馈数据流的基本特性,提出一种场景单元的方式,场景化识别用户行为,实现个性化推荐。
发明内容
本发明的目的是提供一种基于用户反馈数据流的实时个性化推荐方法及系统。本发明的目的是通过以下技术方案来实现:
本发明专利,通过用户反馈数据流,采用多维空间的关系结构,实现实时个性化推荐。包括三大核心装置:用户数据装置、特征库装置、场景装置;所述用户数据装置和特征库装置的关系,用户数据装置处理系统数据和搜索关键词数据,通过特征库装置实现场景分析;所述特征库装置和场景装置的关系,通过特征库装置的多维空间进行个性化识别,由场景装置完成个性化推荐。
所述情感特征库、语义特征库和内容特征库是自我启发的,有记忆力和自学习能力。
基于情感特征库、语义特征库和内容特征库分步骤的完成维度、特征及个性化的分解和识别,做到实时个性化推荐的。
进一步地,场景单元:利用层层识别,标准化技术,拆分为一定行为动作,例如:处理的、分析的、判断的、推荐的、报警的等等,每一个数据行为单元,通过大数据挖掘技术,处理为一个场景单元。
进一步地,内容特征:内容特征不是场景单元,相当于场景单元的元素,场景单元是通过其包含的内容特征识别的,依据多维模型训练、模型验证、模型预测,提取有效的内容特征;场景是一种分析和描述用户综合特征的方法,多维空间结构,直接刻画到场景,帮助用户实现个性化刻画;内容特征是抽象用户行为的有效方法。
进一步地,实时推荐:基于多维空间模型的实时计算匹配的,不仅包括用户操作数据处理,还包括用户的主动要求,搜索关键字以及实时的计算能力,实时场景变化。当用户场景发生改变时,优先通过新的场景映射到对应的多维空间,获得对应的推荐数据。
本发明涉及系统的结构如下:
(001)用户数据流。一般意义上讲,数据流是有顺序的、分段区间的字节集合,程序接收或存储到磁盘的文件以及在网络上进行数据的读写操作,都可以使用数据流来完成。本发明专利指一定场景的具体数据块或存储单元。例如,个性化的一次操作或某一时刻用户个性化作业等等。归纳起来,分为两类,系统采集数据和搜索关键词数据。
(002)系统采集数据。是指系统交互的数据流,严格按系统数据流的方式采集,并按场景进行存储。结合业务功能划分,例如:处理的、分析的、判断的、推荐的、报警的等等,每一个数据存储单元,是一个场景单元,即按业务特征场景细化用户行为。场景单元实现对场景的全覆盖,任何推荐结果的信息都完全具备场景单元的特征。这些特征和业务交互规范进行一一标准化设计和存储,也可以通过技术手段采集,实现自动更新。
(003)搜索关键词。主要对中文关键词的拆分与分词处理并进行分属性管理。搜索关键词分类,为后续语义特征库积累基本的源数据。数据内容识别:文本类:文本、带格式的文本、号码;数字类:数值、金额、百分比;复合型:含有多种关系组合的关键字等等。筛选条件和选择性条件识别,类似于正向表达的规范,例如:搜索课件、视频、作业、答案、讲解、知识点等等。综合数据内容和筛选条件还原具体场景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京点易通科技有限公司,未经北京点易通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710709794.2/2.html,转载请声明来源钻瓜专利网。