[发明专利]文档检测方法及装置有效
申请号: | 201110080838.2 | 申请日: | 2011-03-31 |
公开(公告)号: | CN102156689A | 公开(公告)日: | 2011-08-17 |
发明(设计)人: | 周纾;李彦宏;徐兴军;张雯 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦;李庆波 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种文档检测方法,包括:获取与文档相应地段落特征信息;将所述文档的段落特征信息与至少一个已有文档的段落特征信息进行比对;根据所述比对结果判断是否具有与所述文档相似的已有文档。本发明通过段落特征信息对文档进行检测,可较为准确地进行文档之间的相似度比对,避免了对文档分段处理的作弊行为,且查询效率较高、服务器处理压力较小;将该文档检测方法用于改善在线文档版权属性检测,可在文档上传时,即对该文档进行检测,以避免后续对文档版权属性检测时,给服务器造成的不必要压力;同时,可批量的处理已有文档的版权属性检测,效率较高。 | ||
搜索关键词: | 文档 检测 方法 装置 | ||
【主权项】:
一种文档检测方法,其特征在于,所述文档检测方法包括以下步骤:S1、获取与文档相应地段落特征信息;S2、将所述文档的段落特征信息与至少一个已有文档的段落特征信息进行比对;S3、根据所述比对结果判断是否具有与所述文档相似的已有文档。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110080838.2/,转载请声明来源钻瓜专利网。
- 上一篇:发电机组后备电源自动切换装置
- 下一篇:一种文字变形特效处理方法及装置