[发明专利]一种基于人工智能的特征向量计算方法和相关装置在审
申请号: | 201911149697.8 | 申请日: | 2019-11-21 |
公开(公告)号: | CN110929882A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 邱志勇;黄帆;杨康 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王兆林 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 特征向量 计算方法 相关 装置 | ||
本申请实施例公开一种特征向量的计算方法在计算媒体数据的特征向量时,根据历史用户行为数据从历史媒体数据中确定训练数据集,历史用户行为数据包括用户点击过的历史媒体数据。根据训练数据集,利用向量预测模型得到历史媒体数据的特征向量。由于类型标识可以体现历史媒体数据的内容特点,故统计训练数据集中包括的类型标识,根据类型标识所对应的历史媒体数据的特征向量确定类型标识的特征向量,类型标识的特征向量可以体现出历史媒体数据的内容特点。若获取到未计算得到特征向量的目标媒体数据,目标媒体数据与具有相同类型标识的历史媒体数据类似,则根据目标媒体数据所具有的类型标识的特征向量可以计算得到目标媒体数据的特征向量。
技术领域
本申请涉及计算机领域,特别是涉及一种基于人工智能的媒体数据推荐方法和相关装置。
背景技术
随着信息技术的发展,用户可方便快捷地接触到大量信息例如媒体数据。在互联网网站中,为了有针对性地向用户提供所需要或感兴趣的媒体数据例如新闻、广告、视频等,进而出现了用于向用户推荐媒体数据的系统。
基于媒体数据相似度的推送是推荐系统的核心,而媒体数据可以通过媒体数据的特征向量来表示,因此,为了实现媒体数据的推荐通常需要计算媒体数据的特征向量,以便根据特征向量的相似度确定媒体数据的相似度,实现媒体数据的推荐。
目前,通过无监督训练得到媒体数据的特征向量,之后将媒体数据的特征向量用于推荐任务。然而,当推送系统中新产生媒体数据时,这种方法无法计算新产生的媒体数据的特征向量,从而难以准确地实现推荐服务。
发明内容
为了解决上述技术问题,本申请提供了一种基于人工智能的特征向量计算方法和相关装置,可以计算得到目标媒体数据的特征向量。从而将全部媒体数据的特征向量用户推荐模型的训练,可以准确地实现推荐服务,同时无需重新学习全部媒体数据便可以计算得到目标媒体数据的特征向量,避免消耗大量时间和空间。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供一种基于人工智能的特征向量计算方法,所述方法包括:
根据历史用户行为数据从历史媒体数据中确定训练数据集,所述历史用户行为数据包括用户点击过的历史媒体数据;
根据所述训练数据集,利用向量预测模型得到所述历史媒体数据的特征向量;
统计所述训练数据集中包括的类型标识,所述类型标识用于体现所述历史媒体数据的内容特点;
根据所述类型标识所对应的历史媒体数据的特征向量确定所述类型标识的特征向量;
若获取到未计算特征向量的目标媒体数据,根据所述目标媒体数据所具有的类型标识的特征向量计算所述目标媒体数据的特征向量。
第二方面,本申请实施例提供一种特征向量计算装置,所述装置包括第一确定单元、第二确定单元、统计单元、第三确定单元和计算单元:
所述第一确定单元,用于根据历史用户行为数据从历史媒体数据中确定训练数据集,所述历史用户行为数据包括用户点击过的历史媒体数据;
所述第二确定单元,用于根据所述训练数据集,利用向量预测模型得到所述历史媒体数据的特征向量;
所述统计单元,用于统计所述训练数据集中包括的类型标识,所述类型标识用于体现所述历史媒体数据的内容特点;
所述第三确定单元,用于根据所述类型标识所对应的历史媒体数据的特征向量确定所述类型标识的特征向量;
所述计算单元,用于若获取到未计算特征向量的目标媒体数据,根据所述目标媒体数据所具有的类型标识的特征向量计算所述目标媒体数据的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911149697.8/2.html,转载请声明来源钻瓜专利网。