[发明专利]项目申报数据的查重系统及方法在审
申请号: | 201710591752.3 | 申请日: | 2017-07-19 |
公开(公告)号: | CN110020026A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 孙海彬;张番;胡伟;杨枫;徐信艳;朱伟;贾平 | 申请(专利权)人: | 上海互宝能源科技有限责任公司 |
主分类号: | G06F16/93 | 分类号: | G06F16/93;G06F16/22;G06F16/2458;G06F16/33 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 胡美强;李梦男 |
地址: | 201306 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 非文本数据 项目申报 非关系型数据库 输入模板 索引库 数据输入模块 多个项目 获取数据 历史数据 匹配分析 生成数据 索引存储 相似度 准确率 索引 存储 反馈 申报 创建 | ||
本发明公开了一种项目申报数据的查重系统及方法,查重系统包括:非关系型数据库,用于存储多个项目申报历史数据中的历史非文本数据,并提取历史非文本数据中的特征值以创建索引,还将索引存储于索引库中;数据输入模块,用于生成数据输入模板,并获取数据输入模板接收的待查重的项目申报数据中的待查非文本数据;查重模块,用于提取待查非文本数据中的待查特征值,并将待查特征值与索引库中的所有特征值进行匹配分析,以获取非关系型数据库反馈的包括待查特征值的所有历史非文本数据,查重模块还用于根据所有历史非文本数据计算待查非文本数据的相似度。本发明实现了对项目申报数据中的非文本数据进行查重,大大提高了查重准确率。
技术领域
本发明涉及一种数据查重系统,特别涉及一种创新创业项目申报数据的查重系统及方法。
背景技术
目前,我国每年有大量在校学生及科研人员会申报国家、省地各级各类创新创业项目。为了提高创新创业项目的创新高度,项目评审前需要对其进行查重。现有技术中,有许多网站能提供查重功能,但该些网站只能进行文本查重,不能实现非文本(表格、图像、网页等)查重,故有些项目申报者会通过将文本数据转换为非文本数据来规避查重,以降低其项目论文的相似度。
发明内容
本发明要解决的技术问题是为了克服现有技术中的查重系统不能进行非文本查重的缺陷,提供一种项目申报数据的查重系统及方法。
本发明是通过下述技术方案来解决上述技术问题:
一种项目申报数据的查重系统,其特点在于,所述查重系统包括:
非关系型数据库,用于存储多个项目申报历史数据中的历史非文本数据,并提取所述历史非文本数据中的特征值以创建索引,所述非关系型数据库还用于将所述索引存储于索引库中;
数据输入模块,用于生成数据输入模板,并获取数据输入模板接收的待查重的项目申报数据中的待查非文本数据;
查重模块,用于提取所述待查非文本数据中的待查特征值,并将所述待查特征值与所述索引库中的所有特征值进行匹配分析,以获取非关系型数据库反馈的包括所述待查特征值的所有历史非文本数据,所述查重模块还用于根据所述所有历史非文本数据计算所述待查非文本数据的相似度。
较佳地,所述查重系统还包括:关系型数据库;
所述关系型数据库用于存储所述项目申报历史数据中的历史文本数据;
所述数据输入模块还用于获取所述数据输入模板接收的待查重的项目申报数据中的待查文本数据;
所述查重模块还用于将所述待查文本数据与所述关系型数据库中的所有历史文本数据进行匹配分析,并计算所述待查文本数据的相似度。
较佳地,所述查重模块还用于获取查询条件,并根据所述查询条件提取所述待查文本数据中的内容数据作为待查文本数据和/或待查非文本数据。
较佳地,所述内容数据包括以下数据中的至少一种:
项目标题、关键词、研究意义、国内外研究现状、研究目标、研究内容、拟解决的关键问题、项目名称、项目申请理由、立论依据、研究方案、特色与创新、拟解决的关键问题、计划进度、研究基础和预期研究成果。
较佳地,所述非文本数据包括以下数据中的至少一种:
图像数据、表格数据和网页数据。
较佳地,所述查重模块包括图像查重单元和文本查重单元;
所述数据输入模块还用于从所述图像数据和/或所述表格数据和/或所述网页数据中获取待查文本数据并发送至所述文本查重单元;
所述图像查重单元用于提取所述图像数据中的图像特征值,并将提取出的图像特征值与所述索引库中的图像特征值进行匹配分析,并生成图像数据的相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海互宝能源科技有限责任公司,未经上海互宝能源科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710591752.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法及装置
- 下一篇:一种基于情境感知的档案检索利用方法及系统