[发明专利]一种内容识别的方法、系统和装置无效

专利信息
申请号: 200810089543.X 申请日: 2008-04-07
公开(公告)号: CN101251881A 公开(公告)日: 2008-08-27
发明(设计)人: 高洪涛;刘义俊 申请(专利权)人: 华为技术有限公司
主分类号: G06F21/00 分类号: G06F21/00;G06F17/30
代理公司: 北京挺立专利事务所 代理人: 叶树明
地址: 518129广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 内容 识别 方法 系统 装置
【说明书】:

技术领域

发明实施例涉及通信技术领域,特别涉及一种内容识别的方法、系统和装置。

背景技术

随着互联网的发展,与多媒体内容的相关应用已经非常丰富,例如:音乐、软件或电影下载、视频分享、短信和彩信等。与这些应用伴随而来的版权问题、垃圾和非法信息过滤问题,以及病毒和恶意插件问题也越来越严重。这些问题都对内容的正确识别提出了要求,通过正确识别一项内容,来判断该项内容是否版权保护内容,是否为垃圾信息等尤为重要。

现在,音乐、电影、软件、电子图书等电子内容的下载、分享已经是非常流行的互联网应用。随着这些应用的发展,在各个下载、分享网站上,存在着大量侵犯版权的内容,这些内容为网站吸引了大量的用户。这些内容一般是CP(Content Provider,内容提供商)发行的,未经允许免费自由地在网站上上载和传播,这些内容使CP的正当权益受到极大的损害。

为了解决这类版权问题,目前CI(Content Identification,内容识别技术)逐渐成为一些重要的内容提供商用于保护其内容版权的手段。内容识别技术是指利用内容特征提取技术,提取一项内容区别于其它内容的特征值。首先计算得到正版内容的特征值,再计算在网站上被传播的内容的特征值并与正版内容的特征值进行对比,从而判断该被传播内容是否与正版内容是同一项内容,或是否是正版内容的一部分。如果是,则根据正版内容的版权控制规则,控制被传播内容的传播和使用。

现有技术还有一种通过集中的第三方来建立内容的版权控制数据库,来屏蔽受保护内容的上传的方法,CIDF(Content Identifier Forum,内容标识论坛)制定了一个用于版权保护的应用框架,主要是采用标识符标识需要分发的内容,并将该标识符与相关的内容属性,例如内容本身所具备的属性(例如:大小、类型等)、创建者的属性、版权属性,以及为分发而定义的相关的规则所涉及的分发属性等进行绑定。

但是,本发明的发明人发现,该技术存在以下缺点:该方案对所有类型的内容都使用传统的哈希算法MD5(Message Digest Algorithm5,信息摘要算法5)来计算内容的特征值,只要内容有一个比特改变,就不能正确完成内容的验证和识别,所以采用该方案检测内容,很容易被检测内容规避。

发明内容

本发明实施例提供一种内容识别的方法、系统和装置,以实现根据不同的内容类型,选择合适的识别方法准确地识别内容。

为达到上述目的,本发明实施例一方面提供一种内容识别的方法,包括以下步骤:根据内容类型和业务实体对内容的控制目的选择特征提取算法提取内容特征值,所述内容特征值,包括:如果所述内容类型为文本,并且所述业务实体对内容的控制目的为过滤,则采用传统哈希算法计算所述内容的哈希值,或者先提取所述文本内容的关键字,再计算所述关键字的哈希值,以所述计算得到的哈希值作为所述内容特征值;或者,如果所述内容类型为文本,并且所述业务实体对内容的控制目的为版权保护,则采用传统哈希算法计算所述内容的哈希值,并以所述计算得到的哈希值作为所述内容的特征值;或者,如果所述内容类型为图片、音频或视频,则采用基于内容的哈希算法提取所述内容特征值,所述基于内容的哈希算法包括内容特征提取算法和鲁棒性哈希算法;根据所述内容特征值获取已注册内容的内容属性;根据所述获取的内容属性对所述业务实体的内容进行控制。

另一方面,本发明实施例还提供一种内容识别方法,包括:接收业务实体发送的内容属性查询请求,所述内容属性查询请求包括内容特征值和查询请求类型;根据所述内容属性查询请求中携带的内容特征值;在内容识别管理CIM实体的内容特征数据库中查找与所述内容特征值最接近的已存内容的特征值,所述内容特征值,包括:如果所述内容类型为文本,并且所述业务实体对内容的控制目的为过滤,则采用传统哈希算法计算所述内容的哈希值,或者先提取所述文本内容的关键字,再计算所述关键字的哈希值,以所述计算得到的哈希值作为所述内容特征值;或者,如果所述内容类型为文本,并且所述业务实体对内容的控制目的为版权保护,则采用传统哈希算法计算所述内容的哈希值,并以所述计算得到的哈希值作为所述内容的特征值;或者,如果所述内容类型为图片、音频或视频,则采用基于内容的哈希算法提取所述内容特征值,所述基于内容的哈希算法包括内容特征提取算法和鲁棒性哈希算法,在查找到与所述内容特征值最接近的已存内容的特征值之后,根据所述内容属性查询请求中携带的查询请求类型获取已注册内容的内容属性,并将所述获取的内容属性返回所述业务实体,以供所述业务实体对所述业务实体的内容进行控制。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810089543.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top