[发明专利]一种基于知识图谱的内容推荐方法和系统在审
申请号: | 201910635055.2 | 申请日: | 2019-07-15 |
公开(公告)号: | CN112231547A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 曹秀亭 | 申请(专利权)人: | 普天信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 蒋欢;王琦 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 内容 推荐 方法 系统 | ||
本申请公开了一种基于知识图谱的内容推荐方法,包括:获取用户在一段设定时间内点击过的历史内容,并确定与所述历史内容相似的若干候选内容;对于所述历史内容和所述候选内容,分别使用KCNN将其语义表示与知识表示进行融合,得到各个内容对应的KCNN映射结果;根据所述历史内容和所述候选内容的KCNN映射结果,通过Attention机制确定各个候选内容的得分,所述候选内容的得分表示所述候选内容被所述用户点击的概率;将得分最高的N个候选内容推荐给所述用户,其中,N≥1。本申请还公开了一种对应的内容推荐系统。应用本申请公开的技术方案,能够充分挖掘用户潜在的感兴趣的知识内容,实现更为智能的个性化内容推荐。
技术领域
本申请涉及智能推荐技术领域,特别涉及一种基于知识图谱的内容推荐方法和系统。
背景技术
推荐系统存在的主要意义在于:在信息爆炸的时代,如何从大量的数据中选择合适的信息向个性化用户进行推荐。推荐系统在新闻领域有很大的发展前景,一般来说,新闻语言高度浓缩,充满了知识实体和常识知识。目前的新闻推荐方法主要依靠统计机器进行学习,通过新闻的关键词判断新闻之间的相似性,然后将相似的新闻推荐给用户。
一种现有的实现方案是基于内容相似度进行新闻推荐。基于内容相似度进行新闻推荐,顾名思义,就是将与用户感兴趣的新闻内容相似的新闻推荐给该用户。基于内容相似度的推荐算法的主要优势在于:无冷启动问题,只要用户产生了初始的历史数据(即看了某新闻),就可以开始进行推荐的计算。而且随着用户的浏览记录数据的增加,这种推荐通常也会越来越准确。
这里有两个重要的关键点需要进行说明:
1.如何知道用户喜欢看哪些新闻,即:如何确定用户感兴趣的新闻。
用户有历史的浏览记录,可以从用户历史浏览的新闻中“提取”能代表新闻主要内容的关键词,判断哪些关键词出现得最多。比如:可以有“手机”,“电脑游戏”、“发布会”等等关键词。
或者,也可以统计这些新闻所属的领域是哪些,比如:国际政治、社会、民生、娱乐,找出用户看的新闻来源最多的几个领域。不过,按这种方式判断用户兴趣容易太宽泛,哪怕是同一个领域下的新闻,也可能存在较大差异。比如:某用户可能喜欢A女星,而不喜欢B女星,而如果只是认为该用户喜欢娱乐新闻,结果把B女星的新闻不停地推荐给用户,显然这种推荐是不合适的。而上述的提取关键词的方法就可以比较好地规避这个问题。
2.如何判断两个新闻的内容是否相似
将一篇文本通过词频-逆文本频率指数(TF-IDF:term frequency–inversedocument frequency)算法进行处理,能够返回一组对应于该文本的“关键词-TFIDF值”的词数对,这些关键词最好地代表了这篇文本的核心内容,而这些关键词相对于这篇文本的关键程度由它的TF-IDF值量化。
采用提取关键词并量化关键程度的方法得到两篇文本各自的TF-IDF值后,通过计算这两组TF-IDF值的余弦距离可以得到两篇文本的相似程度,从而利用文本之间的相似度来推荐新闻。
上述基于内容相似度的新闻推荐局限于简单的词匹配,不能合理地扩展,存在很大的不准确性。并且,上述方法没有考虑到用户兴趣的多样性,当用户量达到一定的数量级,整个推荐系统不能为用户进行个性化推荐,从而失去了推荐系统的意义。此外,从技术层面考虑,本申请的发明人发现:现有新闻推荐方法没有利用外在知识,也没有充分发现新闻之间潜在的知识层面的联系,因而无法挖掘用户潜在的感兴趣的知识。
发明内容
本申请提供了一种基于知识图谱的内容推荐方法和系统,以充分挖掘用户潜在的感兴趣的知识内容,实现更为智能的个性化内容推荐。
本申请公开了一种基于知识图谱的内容推荐方法,包括:
获取用户在一段设定时间内点击过的历史内容,并确定与所述历史内容相似的若干候选内容;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普天信息技术有限公司,未经普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910635055.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据传输处理方法及设备
- 下一篇:传动机构
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法