[发明专利]文本相似度匹配的方法、装置及系统在审
申请号: | 201911106810.4 | 申请日: | 2019-11-13 |
公开(公告)号: | CN110956031A | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | 刘晶;黄宇;黄薇蓉;易满成 | 申请(专利权)人: | 广州供电局有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/279;G06F40/186 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 张彬彬 |
地址: | 510620 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 相似 匹配 方法 装置 系统 | ||
本申请涉及一种文本相似度匹配的方法、装置及系统,其中,所述方法包括以下步骤:获取电力系统工作票的工作任务内容;将工作任务内容与工作票数据库中的历史工作内容进行匹配;根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容;将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置。从而实现工作票的快速填写。本申请能够通过识别工作票的工作任务内容,并将工作任务内容与工作票数据库中的历史工作票进行相似度对比,最终选择满足相似度匹配要求的工作内容所对应的安全措施,实现快速匹配填写,提高了工作票的填写效率。
技术领域
本申请涉及文本信息匹配技术领域,特别是涉及一种文本相似度匹配的方法、装置及系统。
背景技术
工作票是准许在电气设备或线路上工作的书面记录;是明确安全职责、向作业人员进行安全交底、履行工作许可手续、以及实施安全技术措施的书面依据;是工作间断、转移和终结的手续。因此,在电气设备或线路上工作时,应按要求正确使用工作票或按命令执行。在实际中,检修人员在电力生产现场、设备或系统上进行检修、维护、安装、改造、调试和试验等工作时需要根据工作票进行现场工作,确保安全生产工作票的填写仍需要人工逐字输入工作任务及对应的安全措施,安全措施的正确与严重依赖于填写人的个人经验与能力水平。
在实现过程中,发明人发现传统技术中至少存在如下问题:传统的对工作票的填写过程中,用户需要对所有内容进行逐一填写,使得用户在填写时需要花费较多的时间进行内容的填写,工作票填写效率低。
发明内容
基于此,有必要针对传统的对工作票的填写过程中,用户需要对所有内容进行逐一填写,使得用户在填写时需要花费较多的时间进行内容的填写,工作票填写效率低的问题,提供一种文本相似度匹配的方法、装置及系统。
为了实现上述目的,本发明实施例提供了一种文本相似度匹配的方法,包括以下步骤:
获取电力系统工作票的工作任务内容;
将工作任务内容与工作票数据库中的历史工作内容进行匹配;
根据匹配的结果,在工作任务内容与历史工作内容的匹配度大于或等于相似内容阈值时,获取工作票数据库中的对应历史安全内容的历史安全措施内容;
将历史安全措施内容加载到电力系统工作票中对应工作任务内容的相应位置。
在其中一个实施例中,将工作任务内容与工作票数据库中的历史工作内容进行匹配的步骤包括:
基于隐马尔可夫模型对工作任务内容进行分词,得到各分词词语信息;
将各分词词语信息依次与工作票数据库中的历史工作内容进行匹配。
在其中一个实施例中,将各分词词语信息依次与工作票数据库中的历史工作内容进行匹配的步骤之后包括:
基于TF-IDF算法处理各分词词语信息和历史工作内容,得到匹配度。
在其中一个实施例中,基于TF-IDF算法处理各分词词语信息和历史工作内容,得到匹配度的步骤包括:
依次将各分词词语信息输入TF-IDF模型进行处理,得到对应各分词词语信息的次数;
基于TF-IDF算法处理各分词词语信息的次数,得到匹配度。
在其中一个实施例中,获取电力系统工作票的工作任务内容的步骤之前还包括:
将电力系统工作票与工作票数据库的历史工作票进行匹配;
获取电力系统工作票的工作任务内容的步骤包括:
在电力系统工作票与历史工作票之间的相似度小于相似工作票阈值时,获取工作任务内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州供电局有限公司,未经广州供电局有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911106810.4/2.html,转载请声明来源钻瓜专利网。