[发明专利]一种基于自然语言处理的检修意见识别方法有效
申请号: | 202011483532.7 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112528627B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 辛阔;许士锦;杨林;单政博;张勇;程哲;孙雁斌;邱生敏;吴小刚;陈兴望;杨凡;张坤;吕耀棠 | 申请(专利权)人: | 中国南方电网有限责任公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/279;G06F40/30;G06F16/903;G06Q10/00;G06Q50/06 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 俞翠华 |
地址: | 510063 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 处理 检修 意见 识别 方法 | ||
本发明公开了一种基于自然语言处理的检修意见识别方法,包括获取构建好的ABNF表达式模型;利用所述ABNF表达式模型对获取到的检修意见进行识别;其中,所述ABNF表达式模型的构建步骤包括:将预设的检修意见拆解成语句;获取构建好的设备实体库;按照预设的规则,以及所述设备实体库,整理所述语句;对整理后的语句进行标识;获取构建好的正则表达式,并存入所述设备实体库;基于所述正则表达式,以及经标识后的语句,生成ABNF表达式模型。本发明通过有效提取检修意见中编写人的真实意图,建立一种让计算机理解各部门检修意见的方法,从而帮助操作人员快速准确地理解各部门检修意见,节省人力成本。
技术领域
本发明属于检修意见处理领域,具体涉及一种基于自然语言处理的检修意见识别方法。
背景技术
随着电网规模的不断扩大,电力设备的数量及种类不断增加,电力设备检修的类型及频次也随之增加,电力设备每一张检修单所涉及的设备数量及种类也越来越多,对核实检修意见的工作人员的要求增高;而且为防止意外,各部门对检修单的意见也随之增加,大量检修单意见增加了工作人员的工作量。
目前存在的问题主要有:
(1)检修意见的识别都是由人工完成,而检修意见里有很多重复性意见必须由人工核实,造成人力资源浪费。
(2)每增加一种新的电力设备,工作人员就需要了解该设备的相关知识,而工作人员的知识水平高低可能导致存在理解偏差。
(3)将检修任务的意见按照部门进行分开展示,由于各部门意见分散,无主次及直观的逻辑关系,无法让人快速且准确地理解填写人的真实意图,可能造成人为的理解偏差。
(4)将检修任务的意见按照部门进行分开展示,对于部门间重复意见,核实检修意见的工作人员需要重复的核对,造成人力资源的浪费。
发明内容
针对上述问题,本发明提出一种基于自然语言处理的检修意见识别方法,通过有效提取检修意见中编写人的真实意图,建立一种让计算机理解各部门检修意见的方法,从而帮助操作人员快速准确地理解各部门检修意见,节省人力成本。
为了实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
一种基于自然语言处理的检修意见识别方法,包括:
获取构建好的ABNF表达式模型;
利用所述ABNF表达式模型对获取到的检修意见进行识别;
其中,所述ABNF表达式模型的构建步骤包括:
将预设的检修意见拆解成语句;
获取构建好的设备实体库;
按照预设的规则,以及所述设备实体库,整理所述语句;
对整理后的语句进行标识;
获取构建好的正则表达式,并存入所述设备实体库;
基于所述正则表达式,以及经标识后的语句,生成ABNF表达式模型。
可选地,所述将预设的检修意见拆解成语句步骤之前还包括:
对预设的检修意见进行清洗。
可选地,所述对预设的检修意见进行清洗,包括以下步骤:
将长度低于3的检修意见,及完全由字母、数字、标点符号、特殊字符组成的检修意见清除;
如果检修意见结尾有多个标点符号,则清除检修意见结尾处的多个标点,只保留最后一个。
可选地,所述将预设的检修意见拆解成语句,具体为:
将预设的检修意见按照符号进行拆解成句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司,未经中国南方电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011483532.7/2.html,转载请声明来源钻瓜专利网。