[发明专利]视频网站的垂直搜索方法及其系统有效
申请号: | 201310740723.0 | 申请日: | 2013-12-26 |
公开(公告)号: | CN103714158A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 曹坤波;郑磊 | 申请(专利权)人: | 乐视网信息技术(北京)股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许志勇 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 网站 垂直 搜索 方法 及其 系统 | ||
1.一种视频网站的垂直搜索方法,其特征在于,包括:
获取多种维度的视频数据的数据源,将所述数据源转换为按照预定数据结构建立的数据模型,并将所述数据模型存储为物化视图文件;
根据所述物化视图文件建立视频数据的倒排索引文件;
根据接收到的检索信息,从所述倒排索引文件中获取视频数据的倒排索引结果集;
根据选定的排序参数对所述倒排索引结果集进行排序。
2.根据权利要求1所述的方法,其特征在于,所述视频数据包括基础数据和扩展数据;所述将所述数据源转换为按照预定数据结构建立的数据模型,包括:
将所述基础数据按照横表的方式进行存储,将所述扩展数据按照列表的方式进行存储。
3.根据权利要求1所述的方法,其特征在于,所述根据所述物化视图文件建立视频数据的倒排索引文件,包括:
通过预设的分词方式对物化视图文件进行分词处理得到关键词;
建立所述关键词与具有所述关键词的物化视图文件之间的索引关系,从而建立视频数据的倒排索引文件。
4.根据权利要求3所述的方法,其特征在于,所述根据接收到的检索信息,从所述倒排索引文件中获取视频数据的倒排索引结果集,包括:
接收对于视频数据的检索信息;
在所述倒排索引文件中匹配所述检索信息,根据与所述检索信息匹配的所述倒排索引文件中的数据得到所述倒排索引结果集。
5.根据权利要求1所述的方法,其特征在于,在所述根据选定的排序参数对倒排索引结果集进行排序之前,所述方法还包括:
接收用户选定的排序参数,所述排序参数包括:视频类型、上映时间、播放时长、视频文件相关的信息。
6.一种视频网站的垂直搜索系统,其特征在于,包括:
数据源处理模块,用于获取多种维度的视频数据的数据源,将所述数据源转换为按照预定数据结构建立的数据模型,并将所述数据模型存储为物化视图文件;
倒排索引模块,用于根据所述物化视图文件建立视频数据的倒排索引文件,以及,根据接收到的检索信息,从所述倒排索引文件中获取视频数据的倒排索引结果集;
排序模块,用于根据选定的排序参数对所述倒排索引结果集进行排序。
7.根据权利要求6所述的系统,其特征在于,所述视频数据包括基础数据和扩展数据;所述数据源处理模块进一步包括:
处理子模块,用于将所述基础数据按照横表的方式进行存储,将所述扩展数据按照列表的方式进行存储。
8.根据权利要求6所述的系统,其特征在于,所述倒排索引模块包括:
关键词获取子模块,用于通过预设的分词方式对物化视图文件进行分词处理得到关键词;
倒排索引建立子模块,用于建立所述关键词与具有所述关键词的物化视图文件之间的索引关系,从而建立视频数据的倒排索引文件。
9.根据权利要求8所述的系统,其特征在于,所述倒排索引模块还包括:
检索信息接收子模块,用于接收对于视频数据的检索信息;
匹配子模块,用于在所述倒排索引文件中匹配所述检索信息,并根据与所述检索信息匹配的所述倒排索引文件中的数据得到所述倒排索引结果集。
10.根据权利要求6所述的系统,其特征在于,所述排序模块包括:
参数接收子模块,用于接收用户选定的排序参数,所述排序参数包括:视频类型、上映时间、播放时长、视频文件相关的信息;
排序子模块,用于根据所述参数接收模块接收的排序参数对倒排索引结果集进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐视网信息技术(北京)股份有限公司,未经乐视网信息技术(北京)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310740723.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种镂空竹球固定夹板
- 下一篇:新型窗帘