[发明专利]一种基于视频搜索的关联资源地址的推送方法和装置有效
申请号: | 201310462461.6 | 申请日: | 2013-09-30 |
公开(公告)号: | CN103491205A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 崔代超 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | H04L29/12 | 分类号: | H04L29/12;H04L29/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视频 搜索 关联 资源 地址 推送 方法 装置 | ||
技术领域
本发明涉及互联网的技术领域,具体涉及一种基于视频搜索的关联资源地址的推送方法和一种基于视频搜索的关联资源地址的推送装置。
背景技术
视频搜索引擎是有别于综合搜索的一种垂直搜索技术。视频搜索引擎抓取互联网中的视频类的结果并建立索引,由于它可以向搜索者提供纯粹的视频类结果,从而可以大大节省网民寻找视频的时间。
根据视频搜索的相关统计数据显示,娱乐、游戏、影视、新闻、动漫等类型的视频是用户的主要搜索对象。这表明用户对于视频搜索本身具有泛需求的性质。用户往往不带有很强的目的性,搜索结果并非“非彼不可”,而是带有一定扩展性,只要目标在用户所喜欢的范畴内即可。因此,往往会在搜索结果之外对用户进行相关推荐是。
但是,现有的视频搜索引擎在相关推荐方面做得还有不足:部分视频搜索引擎没有相关推荐,有相关推荐的视频搜索引擎只是根据用户的搜索历史数据、通过人工整理得到关联体系等简单方式实现推荐。这种推荐系统基于用户已有的搜索习惯,召回率较低,另外由于用户的搜索范围一般会比现有互联网中的资源范围要小很多,不能充分挖掘互联网中的优质视频。
另一种搜索推荐方法是依靠人工整理出一个资源关联体系或从其他知识体系中得到这样的体系,应用到推荐系统中。例如在某搜索引擎搜索”广场舞”时,会得到“交谊舞”、“肚皮舞”、“健身操”等的推荐词,搜索“dota”时会得到“穿越火线”、“魔兽世界”等的推荐词,但是这种体系召回率较低,在长尾的搜索中一般不能给出推荐。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于视频搜索的关联资源地址的推送方法和相应的一种基于视频搜索的关联资源地址的推送装置。
依据本发明的一个方面,提供了一种基于视频搜索的关联资源地址的推送方法,包括:
当接收到第一视频资源数据的加载或播放请求时,获取所述第一视频资源数据的特征本文本信息;
将所述特征本文本信息映射为一个或多个第一分词;
查找与所述一个或多个第一分词的同现率高于预设阈值的关联第二分词;所述同现率为当前一个或多个第一分词与第二分词在同一视频资源数据中共同出现的概率;
获取与所述一个或多个第一分词和所述关联第二分词匹配的第二视频资源数据的网络链接地址;
推送所述第二视频资源数据的网络链接地址。
可选地,所述当接收到第一视频资源数据的加载或播放请求时,获取所述第一视频资源数据的特征本文本信息的步骤包括:
当接收到第一视频数据的播放请求时,接收当前终端发送的所述第一视频资源数据的特征本文本信息;
或者,
当接收到第一视频数据加载请求时,提取本地预置的所述视频资源数据的特征本文本信息。
可选地,所述将所述特征本文本信息映射为一个或多个第一分词的步骤包括:
提取所述特征本文本信息所映射的一个分词;
或者,
当接收到的特征本文本信息为复合词时,将所述特征本文本信息拆分为多个搜索子词;提取所述多个搜索子词所映射的多个分词。
可选地,所述查找与所述一个或多个第一分词的同现率高于预设阈值的关联第二分词的步骤包括:
当所述特征本文本信息被映射为一个第一分词时,提取所述第一分词对应的预置索引表;其中,所述索引表包括所述第一分词所属的视频资源数据的信息,以及,所述视频资源数据中的所有分词;所述视频资源数据中的所有分词为通过抓取视频资源数据,提取所述视频资源数据的特征文本信息,对所述特征文本信息进行分词生成;
计算所述第一分词与所述索引表中各个第二分词的同现率,所述同现率为所述索引表中各个第二分词出现的次数与所述索引表中视频资源数据的信息总数的比值;其中,所述第二分词为所述视频资源数据中的所有分词中除所述第一分词以外的分词;
提取所述同现率高于预设阈值的第二分词作为关联第二分词。
可选地,所述查找与所述一个或多个第一分词的同现率高于预设阈值的关联第二分词的步骤包括:
当所述特征本文本信息被映射为多个第一分词时,分别提取所述多个第一分词对应的多个预置索引表;各个索引表中包括所述第一分词所属的视频资源数据的信息,以及,所述视频资源数据中的所有分词;所述视频资源数据中的所有分词为通过抓取视频资源数据,提取所述视频资源数据的特征文本信息,对所述特征文本信息进行分词生成;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310462461.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种协同增效杀菌剂及其制备方法
- 下一篇:基站频谱分配