[发明专利]一种下载视频网站动态生成视频评论的方法无效
申请号: | 201210185876.9 | 申请日: | 2012-06-07 |
公开(公告)号: | CN102722580A | 公开(公告)日: | 2012-10-10 |
发明(设计)人: | 王兴起;姜明;岑沛斯;沈幸峰;郭利刚;胡宏宇;祁磊 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 下载 视频 网站 动态 生成 评论 方法 | ||
技术领域
本发明涉及一种下载视频网站视频评论的方法,尤其涉及下载动态生成的视频评论的方法。
背景技术
视频评论是视频一个不可缺少的部分,当今主流的视频网站比如优酷网,土豆网等网站的视频都有视频评论。通过这些评论可以大概的知道观众对这些视频的态度。一些视频反映了社会上的现象,通过视频评论可以发现观众对这些现象的评价。视频评论还是观众之间交流的平台,观众可以通过在视频下方留言表达自己的观点,不同的观众可以通过这里对别人的观点进行评论也可以阐述自己的观点。
视频评论除了表达自己的情绪外,一般都是关于此视频内容的评论,通过这些内容不看视频大致可以知道他的内容,搜索引擎可以根据评论的内容来判断是否符合搜索的主题,这有助于搜索引擎对此视频的搜索。
视频网站对视频评论的传统处理方式是在html页面中直接嵌套评论的内容,这种方式没有做到业务逻辑与数据层的分离,使表现层包含了太多的数据,不仅使代码臃肿而且不易维护,响应速度也受到了很大的影响。为了解决传统方式存在的种种弊端,当今的主流视频网站都采用了动态产生评论数据的方式,在html页面中找不到具体的内容,这种方式提高了网站的响应速度,但对搜索引擎却是个不好的消息,因为传统的搜索引擎注重于文字的搜索,现在对html页面进行搜索时却发现只能找到少量的文字,这不能帮助他们对此页面的内容进行判断。
发明内容
本发明针对视频网站动态产生视频评论的方式提出了一种通过与服务器进行二次动态交互,获取视频评论的方法,该方法解决了传统搜索引擎不能搜索到视频评论的局面,扩大了他们的搜索范围。
本发明方法具体包括以下步骤:
步骤1)分析视频页面源代码,获得videoid参数值,根据videoid参数值获得新的URL地址,与服务器进行第一次交互。
步骤2)分析第一次交互返回页面的内容,获得last_sid参数,last-modify参数,page参数,根据last_sid参数值,last-modify参数值、page参数、id参数值获得新的URL地址,与服务器进行第二次交互。
步骤3)分析第二次交互返回页面的内容,获得评论数据的Unicode码,通过对Unicode码进行转码获得评论数据的中文信息并存入数据库。
本发明的有益效果:
1.本发明面向视频网站动态生成评论的下载,面向的是动态生成的视频评论,不涉及简单显示在html页面的视频评论的下载,解决了因视频网站改版而搜索不到视频评论的不足。
2.本发明基于和服务器进行交互而得到视频评论,具有响应快,准确率高的特点。
附图说明
图1为下载过程流程图;
图2 为视频评论下载结果图。
具体实施方式
以下结合附图对本发明作进一步说明。
一种下载视频网站动态生成视频评论的方法的下载流程如图1。
首先,在数据库中建立一个包含vid,vTitle,vcommentcontent, vclickrate,vcomments,vdatatime六列的数据表,用来保存下载下来的视频评论。其中vid(int)代表某一个评论数据在据库中排列的序列号,vTitle(varchar) 代表某一个视频的名称,vcommentcontent (varchar)代表某一个视频视频评论的具体内容,vclickrate(varchar)代表某一个视频的点击量,vcomments(varchar)代表某一个视频的评论量, vdatatime(varchar)代表存入数据库的时间。
其次,以优酷网为例,下载其视频的视频评论。以URL地址为http://v.youku.com/v_show/id_XMzg1MDI0NzI4.html的视频为例。可以从其源代码中提取videoId参数的值,包含此参数的源代码如下:
var un_ame='';
var videoId = '96256182';
var videoId2= 'XMzg1MDI0NzI4';
var version=/v1.0.0758;
var imgServer = 'http://static.youku.com';
var UC_FOLLOW_HOST = i.youku.com;
var douban_num = '';
var imdb_num = '';
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210185876.9/2.html,转载请声明来源钻瓜专利网。