[发明专利]一种基于引用的论文原创性检测方法有效
申请号: | 201810870256.6 | 申请日: | 2018-08-02 |
公开(公告)号: | CN109284485B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 刘刚;王贺飞;杨笑笑 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/205 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于引用的论文原创性检测方法,涉及论文检索对比领域。本发明提出了从引文的角度对剽窃行为进行研究,并设计了文本的引用特征来对引文进行分析,将正文与文末的参考文献分割开来,对分割后的参考字符串进行切分,创建书目列表,根据书目作者与出版年份定位引文,并利用解析器进行提取,对于实验文本首先分析其书目列表,若其共享引用书目超过某阈值,则进行下一阶段的分析,对于被筛选出的文档分析其最长公共引用序列,若其值小于某阈值,则将其从实验文本集中淘汰,对于顺利通过前两阶段检测的文本进行引文分析,通过引用块的最大重叠数来衡量文本的剽窃程度。本发明对学术不端检测具有重要意义,有利于学术风气的规范、科研水平的提高。 | ||
搜索关键词: | 一种 基于 引用 论文 原创 检测 方法 | ||
【主权项】:
1.一种基于引用的论文原创性检测方法,其特征在于,包括以下步骤:(1)语料库处理;(2)参考书目分割与提取;(3)引文识别与提取,根据书目作者与出版年份定位引文,并利用解析器进行提取;(4)基于引用特征的剽窃检测,候选文档生成阶段采用的引用特征包括:书目耦合、最长公共引用序列以及引文分块;通过结合以上三种引用特征来判定抄袭,得到最终剽窃结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810870256.6/,转载请声明来源钻瓜专利网。
- 上一篇:特征编码方法及装置
- 下一篇:文本相似性度量方法、装置、终端及存储介质