[发明专利]一种面向电力行业的项目相似性对比方法有效
申请号: | 201810521004.2 | 申请日: | 2018-05-28 |
公开(公告)号: | CN108846031B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 段飞虎;吕强;冯自强;张宏伟;邓春宇;季知祥;史梦洁;陈立斌;王冠群;徐翀;梁芙翠;王頔;魏冠元;付蓉;马铁群;朱承志;孙黎滢;谷记亭 | 申请(专利权)人: | 同方知网数字出版技术股份有限公司;中国电力科学研究院有限公司;国网能源研究院有限公司;国网浙江省电力有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289;G06F40/30 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 陈新胜 |
地址: | 100084 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向电力行业的项目相似性对比方法,该方法包括:将文本进行碎片化处理,统一格式并保存在数据库中;通过KBase数据库检索出与比对项目最相似的几篇文本;将相似文本分别与比对文本进行比较;将所有相似文本的比对结果进行分析,并按照比对顺序形成结果输出;对对比语句的相似度进行优化,该优化采用并行计算使用多个线程同时计算。所述方法通过将文本按照句子进行拆分,并进行分词达到文本表示最小粒度,之后根据电力主题词进行语义分析,并在数据库所有项目中查找相似文本标记输出;提高了申报项目查重比对的效率,减少了人力物力等资源的浪费。 | ||
搜索关键词: | 一种 面向 电力行业 项目 相似性 对比 方法 | ||
【主权项】:
1.一种面向电力行业的项目相似性对比方法,其特征在于,所述方法包括:步骤10将文本进行碎片化处理,统一格式并保存在数据库中;步骤20通过KBase数据库检索出与比对项目最相似的几篇文本;步骤30将相似文本分别与比对文本进行比较;步骤40将所有相似文本的比对结果进行分析,并将重复内容标记后按照原文顺序输出;步骤50对对比语句的相似度进行优化,该优化采用并行计算使用多个线程同时计算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同方知网数字出版技术股份有限公司;中国电力科学研究院有限公司;国网能源研究院有限公司;国网浙江省电力有限公司,未经同方知网数字出版技术股份有限公司;中国电力科学研究院有限公司;国网能源研究院有限公司;国网浙江省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810521004.2/,转载请声明来源钻瓜专利网。