[发明专利]一种利用计算机程序检测电子文本剽窃的方法无效
申请号: | 03134562.X | 申请日: | 2003-09-10 |
公开(公告)号: | CN1492327A | 公开(公告)日: | 2004-04-28 |
发明(设计)人: | 鲍军鹏 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F11/28 | 分类号: | G06F11/28 |
代理公司: | 西安通大专利代理有限责任公司 | 代理人: | 李郑建 |
地址: | 710049*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种利用计算机程序检测电子文本剽窃的方法。该计算机程序至少包括电子文本的收集和录入;电子文本特征提取;文本特征库管理和文本剽窃判定。本发明首先根据文本的结构信息和语义信息提取文本特征;然后运用文本剽窃判定模块中设定的探针法估计待检测文本特征和特征库中的文本特征的最大共同语义并给出文本雷同度量;最后据此判定是否有剽窃,如果雷同度大于或者等于某个阈值则认为检测文本中存在剽窃,否则认为检测文本中没有剽窃。 | ||
搜索关键词: | 一种 利用 计算机 程序 检测 电子 文本 剽窃 方法 | ||
【主权项】:
1.一种利用计算机程序检测电子文本剽窃的方法,该计算机程序至少包含:1)电子文本提交、收集和录入模块,其用以向系统提交待检测文本或者增添新文本;2)文本特征提取模块,其用以提取文本特征;3)文本特征库,其用以存储所有文本特征;4)文本剽窃判定模块,其用以判定待检测文本中是否含有剽窃内容;其特征在于,包括以下步骤:①首先文本特征提取模块根据文本的结构信息和语义信息提取待检测文本特征;②然后运用文本剽窃判定模块中设定的探针法估计待检测文本特征和特征库中的文本特征的最大共同语义并给出文本雷同度量;③最后据此判定是否有剽窃,如果雷同度大于或者等于某个阈值则认为检测文本中存在剽窃,否则认为检测文本中没有剽窃。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/03134562.X/,转载请声明来源钻瓜专利网。