[发明专利]一种内容挖掘方法、装置及相关产品有效

专利信息
申请号: 202110636994.6 申请日: 2021-06-08
公开(公告)号: CN113254503B 公开(公告)日: 2021-11-02
发明(设计)人: 苑鹏程;贺文嵩;顾晓光 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/901;G06F16/906;G06F16/9535;G06F16/9536
代理公司: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 常忠良
地址: 518064 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 内容 挖掘 方法 装置 相关 产品
【说明书】:

本申请实施例公开一种内容挖掘方法、装置及相关产品,涉及计算机技术领域。方法具体公开了:获取种子内容集合,其中所包括的多个内容均具有预设内容属性;根据与种子内容集合关联的候选用户集合对种子内容集合的交互行为数据,从候选用户集合中确定出目标用户;基于目标用户对候选内容集合的交互行为数据,确定目标挖掘内容。此方法不需要建立复杂的图结构,即便对所挖掘内容具有较高的时效性要求,也可以频繁、快捷地进行内容挖掘。节省挖掘过程中对计算资源的消耗,有效避免了噪声的引入,提升了内容的纯净度。

技术领域

本申请涉及计算机技术领域,尤其涉及一种内容挖掘方法、装置及相关产品。

背景技术

随着互联网的快速发展,互联网上的内容越来越丰富,用户可以通过计算机设备在互联网上轻松获得各种类型的内容,例如视频、音频、图片或文档等。用户既可以作为内容的消费者,还可以作为内容的生产者。目前在许多互联网平台上,各式各样的内容已经呈现井喷之势。以新闻场景为例,在每天累计生产的新闻内容可以多达上千万条图文和视频。以视频网站为例,每天业余用户和专业团队产出的视频内容可以多达上百万段。海量的内容数据给运营带来了极大的挑战,平台运营方一方面需要甄别内容生产者生产的内容,另一方面还需要为用户提供内容的个性化服务,对用户精准投放其可能感兴趣的内容。由人工甄别内容在成本高且效率低,因此面对海量的内容数据,亟需自动实现内容挖掘的技术解决平台运营方的难题。

现有技术中提供了一种基于图结构的数据挖掘方法,对用户和多源数据进行统一建模和特征表达,通过对特征表达后的数据进行聚类,得到分类信息后。对数据进行距离分析,其中距离越近表示两者的关联度越高,可以根据初始定义的种子数据,挖掘出与之关联度高的对应数据。然而在用户数量庞大的场景中,构建完整的图结构需要耗费非常多的计算资源,由于挖掘内容的时效性,每次挖掘都需要建立全局的图结构,致使计算资源的消耗更加庞大。另有一些内容挖掘方法在挖掘过程中由于中间过程较多,导致引入了较多的噪声,致使挖掘出的内容数据的质量不高,进而降低了个性化服务时所挖掘内容的可用性。结合以上分析,目前如何以较少的计算资源实现内容挖掘并保证所挖掘内容的质量,已经成为本领域亟待解决的技术问题。

发明内容

本申请实施例提供了一种内容挖掘方法、装置及相关产品,以节省内容挖掘过程中的资源消耗,并提升所挖掘内容的质量。

有鉴于此,本申请第一方面提供了一种内容挖掘方法,方法包括:

获取种子内容集合;种子内容集合包括的多个内容均具有预设内容属性;

根据与种子内容集合关联的候选用户集合对种子内容集合的交互行为数据,从候选用户集合中确定出目标用户;

基于目标用户对候选内容集合的交互行为数据,确定目标挖掘内容,目标挖掘内容包括候选内容集合中的一个或多个内容。

本申请第二方面提供一种内容挖掘装置,装置包括:

种子获取单元,用于获取种子内容集合;种子内容集合包括的多个内容均具有预设内容属性;

用户确定单元,用于根据与种子内容集合关联的候选用户集合对种子内容集合的交互行为数据,从候选用户集合中确定出目标用户;

内容确定单元,用于基于目标用户对候选内容集合的交互行为数据,确定目标挖掘内容,目标挖掘内容包括候选内容集合中的一个或多个内容。

本申请第三方面提供一种计算机设备,设备包括处理器以及存储器:

存储器用于存储程序代码,并将程序代码传输给处理器;

处理器用于根据程序代码中的指令,执行如上述第一方面的内容挖掘方法的步骤。

本申请第四方面提供一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行上述第一方面的内容挖掘方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110636994.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top