[发明专利]一种相关性的计算方法及装置有效
申请号: | 201711478751.4 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108200449B | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 王铭 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | H04N21/234 | 分类号: | H04N21/234;H04N21/2668;H04N21/81;H04N21/84;H04N21/845;G06Q30/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相关性 计算方法 装置 | ||
本发明提供一种相关性的计算方法及装置,只需要获取视频和每个广告类别之间的相关性,以及获取每个候选广告和每个广告类别之间的相关性,即可计算得到视频与每个候选广告之间的相关性,因此只需要存储视频和每个广告类别之间的相关性以及每个候选广告和每个广告类别之间的相关性。视频和广告类别之间的相关性的总数为视频的总数乘以广告类别的总数,候选广告和广告类别之间的相关性的总数为候选广告的总数乘以广告类别的总数。通常广告类别的总数通常为数百个,需要存储的数据总量为数千万乘以数百与数十万乘以数百后的和值,此和值远远小于数千万乘以数十万的值,即本申请需要存储的数据总量远远小于现有技术中存储的数据总量,节省了存储空间。
技术领域
本发明属于多媒体技术领域,尤其涉及一种相关性的计算方法及装置。
背景技术
随着新媒体环境的不断深化,相应的信息技术也随之进步。在信息领域内,不断扩张的用户需求促进着技术、服务等业务的快速发展。在此背景下,作为互联网热门行业的网络视频领域发展迅速。由于视频网站庞大的用户群体,越来越多的广告商已经将注意力逐渐移向视频网站。
目前,视频网站播放广告的手段是基于视频和广告之间的相关性,选择与视频相关性高的广告以插播到当前播放的视频中。当在播放一个视频时,存在多个候选广告,需要在线计算当前播放的视频与每个候选广告之间的相关性,导致不能及时响应插播广告的请求。对此,现有技术采用的技术手段是离线计算每个视频和每个广告之间的相关性,并将其存储到数据库中,当接收到插播广告的请求时,直接从数据库中查找当前播放视频与多个候选广告之间的相关性,并根据查找到的相关性确定插播的广告。
但是,由于视频网站内的视频数量很大,通常为数千万个,同时广告总量也很大,通常为数十万个,因此离线分别计算出每个视频与每个广告之间的相关性后,数据库中需要存储数千万与数十万级相乘后得到的数量的相关性数据,导致占用大量的存储空间。
发明内容
有鉴于此,本发明的目的在于提供一种相关性的计算方法及装置,用于解决现有技术中占用存储空间大的问题。
技术方案如下:
本发明提供一种相关性的计算方法,包括:
在播放视频的过程中接收到在所述视频中插播广告的请求时,
根据所述视频的标识获取所述视频与每个广告类别之间的相关性;根据候选广告的标识获取每个所述候选广告分别与每个所述广告类别之间的相关性;其中,所述候选广告为插播到所述视频中的广告;
根据所述视频与每个所述广告类别之间的相关性和每个所述候选广告分别与每个所述广告类别之间的相关性,分别计算所述视频与每个所述候选广告之间的相关性。
优选地,所述接收在视频中插播广告的请求之前,还包括:
分别获取每个所述视频的描述文件、每个所述广告类别的描述文件和每个广告的描述文件;
根据所述视频的描述文件和所述广告类别的描述文件,分别计算并存储每个所述视频和每个所述广告类别之间的相关性;
根据所述广告的描述文件和所述广告类别的描述文件,分别计算并存储每个所述广告和每个所述广告类别之间的相关性。
优选地,所述分别获取每个所述视频的描述文件、每个所述广告类别的描述文件和每个所述广告的描述文件之后,还包括:
去除每个所述广告类别的描述文件中的无效描述词。
优选地,所述根据候选广告的标识获取每个所述候选广告分别与每个所述广告类别之间的相关性后,还包括:
判断是否获取到所述候选广告分别与每个所述广告类别之间的相关性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711478751.4/2.html,转载请声明来源钻瓜专利网。