[发明专利]基于终端的论文查重方法、终端及存储介质在审
申请号: | 201810534771.7 | 申请日: | 2018-05-30 |
公开(公告)号: | CN108763486A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 张勇;李威 | 申请(专利权)人: | 湖南写邦科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 长沙科永臻知识产权代理事务所(普通合伙) 43227 | 代理人: | 杨琦玲 |
地址: | 410205 湖南省长沙市长沙高新*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本内容 终端 语句 页面 存储介质 文档页面 相似度 文档 预设 编辑修改 检测报告 接收用户 修改位置 指纹匹配 终端显示 索引 原文 数据库 指令 查找 响应 | ||
1.一种基于终端的论文查重方法,其特征在于,包括步骤:
响应用户的论文查重请求;
将所述论文与预设数据库中的文本内容进行指纹匹配,以确定所述论文与所述文本内容间的相似度;
在终端显示界面上同时显示至少三个页面;所述至少三个页面包括:用于接收所述用户的编辑修改指令的第一论文文档页面,专用于显示所述相似度超过预设阈值时所述论文中对应标记的语句的第二论文文档页面,以及用于索引和显示所述语句对应的所述文本内容的页面。
2.根据权利要求1所述的基于终端的论文查重方法,其特征在于,所述终端显示界面上还设有查重按钮;
所述在终端显示界面上同时显示至少三个页面的步骤之后还包括:
通过所述查重按钮侦测用户的点击操作,并在侦测到所述用户的点击操作时触发重新确定所述论文与所述文本内容间的相似度;
根据重新确定的相似度,更新所述第二论文文档页面。
3.根据权利要求1所述的基于终端的论文查重方法,其特征在于,所述将所述论文与预设数据库中的文本内容进行指纹匹配,以确定所述论文与所述文本内容间的相似度的步骤包括:
获取预设数据库中所有的文本内容分别对应的指纹以及所述论文的总字数;
对所述论文进行切分以形成论文单元,并以所述论文单元作为输入数据,通过相似性哈希算法计算每个所述论文单元分别对应的论文单元指纹;
从所有的文本内容分别对应的指纹中,查找与论文单元指纹相似的所有指纹;
根据查找到的所有相似的指纹,加载对应的相似文本内容;
根据所述相似文本内容、所述论文单元以及所述论文的总字数,计算所述论文与所述文本内容间的相似度。
4.根据权利要求3所述的基于终端的论文查重方法,其特征在于,所述文本内容分别对应的指纹为N位指纹;
所述获取预设数据库中所有的文本内容分别对应的指纹以及所述论文的总字数的步骤之后还包括:
将所有文本内容分别对应的指纹分成M块,以形成M个指纹分块,其中每个指纹分块具有N/M位指纹;
以具有N/M位的指纹为关键词,为M个指纹分块分别建立倒排索引;
所述根据查找到的所有相似的指纹,加载对应的相似文本内容的步骤包括:
确定每个相似的指纹所属的指纹分块;
以所述相似的指纹为关键词,从该关键词所属指纹分块所在倒排索引中查找所述相似的指纹对应的相似文本内容。
5.根据权利要求4所述的基于终端的论文查重方法,其特征在于,所述论文单元指纹为N位指纹;
所述从所有的文本内容分别对应的指纹中,查找与论文单元指纹相似的所有指纹的步骤包括:
将所有论文单元指纹分成M块,以形成M个论文指纹分块,其中每个论文指纹分块具有N/M位指纹;
依次将每个论文指纹分块与每个指纹分块进行比较,以查找出相似的所有指纹。
6.根据权利要求3所述的基于终端的论文查重方法,其特征在于,所述根据所述相似文本内容、所述论文单元以及所述论文的总字数,计算所述论文与所述文本内容间的相似度的步骤包括:
根据所述相似文本内容,从所有的论文单元中查找出每个相似文本内容对应的相似论文单元;
对每个相似文本内容以及对应的相似论文单元进行分词,得到每个相似文本内容的文本分词集合以及每个相似论文单元的论文分词集合;其中,一个文本分词集合由一个相似文本内容中的若干个词语构成,一个论文分词集合由一个相似论文单元中的若干个词语构成;
获取每个相似文本内容的文本长度以及对应的相似论文单元的文本长度;
通过每个相似文本内容的文本长度、文本分词集合、每个相似论文单元的文本长度以及论文分词集合,计算所述论文与所述文本内容之间的相似字数;
将所述相似字数与所述总字数相除得到的商作为所述论文与所述文本内容间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南写邦科技有限公司,未经湖南写邦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810534771.7/1.html,转载请声明来源钻瓜专利网。