[发明专利]一种基于BiLSTM-CRF模型的电力调度领域命名实体识别方法及系统在审

专利信息
申请号: 202010318430.3 申请日: 2020-04-21
公开(公告)号: CN111553158A 公开(公告)日: 2020-08-18
发明(设计)人: 范士雄;林静怀;徐郑崎;范海威;冯长有;韩晔;吴炜;皮俊波;王晶;刘幸蔚;李立新;於益军;廖志芳;赵祎祺;宋耀伦;吴锟;闫丽芬 申请(专利权)人: 中国电力科学研究院有限公司;国家电网有限公司;国网福建省电力有限公司;中南大学
主分类号: G06F40/295 分类号: G06F40/295;G06F40/242;G06N3/04;G06N3/08;G06Q50/06
代理公司: 北京宝护知识产权代理有限公司 11703 代理人: 张弘
地址: 100192 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 bilstm crf 模型 电力 调度 领域 命名 实体 识别 方法 系统
【说明书】:

发明提出了一种基于BiLSTM‑CRF模型的电力调度领域命名实体识别方法及系统,该方法包括,对原始语料进行分词,并进行标注,将标注结果转化为符合BiLSTM‑CRF模型输入格式的第一标注结果;以所述BiLSTM‑CRF模型为基础对所述第一标注结果进行识别并输出第二标注结果;从所得的第二标注结果中还原识别出的电力调度领域的命名实体。本发明的电力调度领域命名实体识别方法在一定程度上提高了电力调度领域命名实体识别的效率,并且能够保证电力调度领域命名实体识别结果具有较好的准确率和召回率。

技术领域

本发明涉及电力调度及计算机技术领域,具体涉及一种基于BiLSTM-CRF模型的电力调度领域命名实体识别方法及系统。

背景技术

随着智能电网建设的持续推进以及智能电网各类业务的发展,中国智能电网在特高压等许多方面已经走到世界前列,电网调度自动化系统对智能电网的安全运行越来越起着不可或缺的作用。调度自动化系统各类应用越来越多,业务知识也越来越复杂,相关业务人员大多只了解局部的业务知识,而不清楚与之相关的业务逻辑,只有极少数专家级人员才能对整个业务流程有清晰的认识。因此当复杂的业务逻辑出现问题时,需要临时调动有关业务人员,理清业务逻辑关系,才有可能找出引起问题的原因。而若建立起整个调度自动化系统相关业务的知识图谱,就可以根据知识图谱所表达的相关业务逻辑,十分清晰地查询所有的操作和数据流,从而找出产生错误的可能原因。

值得注意的是,在构建度自动化系统相关业务的知识图谱前,需要对电力调度领域的文本语料进行命名实体识别,这是一项关键工作及技术。对于一段文本,命名实体识别技术可以发现和定位文本中与给定主题相关联的关键词,即命名实体,并在这些实体之间建立联系。命名实体识别技术已经在医疗病历服务,机器翻译,微博文本分析等领域具有大量研究与应用。

然而,相关资料显示,当前电力调度领域命名实体的自动化识别并不理想,大部分情况下仍然需要依靠人工手段进行信息抽取,尤其当文本语料完全是非结构化文本时,基于规则的抽取方法不再适用,这就导致目前工作人员无法在非结构化电力调度文本语料中进行有效的命名实体识别工作。

发明内容

本发明为解决上述技术问题,提出了一种基于BiLSTM-CRF模型的电力调度领域命名实体识别方法及系统,目的是实现通过自动化的方法进行电力调度领域命名实体抽取。

为了实现上述目的,本发明采用如下技术方案:

一种基于BiLSTM-CRF模型的电力调度领域命名实体识别方法,该方法包括:

步骤S100.对原始语料进行分词,以构造出词语边界明确的电力调度实体词典;

步骤S200.对所述词典中的词语进行词角色标注,并将标注后的内容转化为符合所述BiLSTM-CRF模型输入格式的第一标注结果;

步骤S300.以所述BiLSTM-CRF模型为基础对所述第一标注结果进行识别并输出第二标注结果;

步骤S400.从所述第二标注结果中还原识别出所述电力调度领域的命名实体。

进一步的,所述步骤S100具体包括:

步骤S101.原始语料经基于互信息和左右熵的短语提取算法处理,得到固定长度文本片段的互信息值和左右熵;

步骤S102.统计文本片段出现的频率,这些统计规则之后根据分词的效果进行参数调整;

步骤S103.经人工审核后得到质量较高的电力调度实体词典。

进一步的,所述词角色的类型包括调度机构SM、调度人员SP、调度操作SO、电力设施设备FAC、调度管理要求MR、电力资料EPD、调度条件SC、设备状态ES。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院有限公司;国家电网有限公司;国网福建省电力有限公司;中南大学,未经中国电力科学研究院有限公司;国家电网有限公司;国网福建省电力有限公司;中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010318430.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top