[发明专利]基于深度学习的电力技术标准信息提取方法及提取系统在审
申请号: | 202211604427.3 | 申请日: | 2022-12-13 |
公开(公告)号: | CN116089564A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 胡维;刘晗;黄鑫;冯晓文;田建伟;向行;王康;刘亮 | 申请(专利权)人: | 国网湖南省电力有限公司;国网湖南省电力有限公司信息通信分公司;国家电网有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06N3/047;G06N3/048;G06N3/08;G06F40/242 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410004 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 电力 技术标准 信息 提取 方法 系统 | ||
本发明公开了一种基于深度学习的电力技术标准信息提取方法,包括获取历史电力技术标准;采用word2vec词向量模型转换为词向量;构建电力技术标准信息提取初始模型并采用词向量训练得到电力技术标准信息提取模型;将实际的电力技术标准输入到电力技术标准信息提取模型得到提取的电力技术标准信息。本发明还公开了一种实现所述基于深度学习的电力技术标准信息提取方法的提取系统。本发明公开的这种基于深度学习的电力技术标准信息提取方法及提取系统,通过收集电力技术标准数据,训练信息提取模型然后进行数据汇总统计,实现了电力技术标准关键信息的自动提取汇总统计的全流程;因此本发明的可靠性高、精确性好且效率较高。
技术领域
本发明属于电气自动化领域,具体涉及一种基于深度学习的电力技术标准信息提取方法及提取系统。
背景技术
随着经济技术的发展和人们生活水平的提高,电能已经成为了人们生产和生活中必不可少的二次能源,给人们的生产和生活带来了无尽的便利。因此,保障电能的稳定可靠供应,就成为了电力系统最重要的任务之一。
电力技术标准是电力系统的重要组成部分;因此,对于电力技术标准的查询和信息提取就显得尤为重要。目前,传统的电力计数标准的信息提取工作,依旧采用的是人工的方式进行提取,即技术人员找到技术标准后,再人为的将所需要的标准信息提取出来。但是,这种人工提取的方式,不仅费时费力,效率极低,而且容易出现人为带来的错误。
发明内容
本发明的目的之一在于提供一种可靠性高、精确性好且效率较高的基于深度学习的电力技术标准信息提取方法。
本发明的目的之二在于提供一种实现所述基于深度学习的电力技术标准信息提取方法的提取系统。
本发明提供的这种基于深度学习的电力技术标准信息提取方法,包括如下步骤:
S1.获取历史电力技术标准;
S2.将步骤S1获取的电力技术标准,采用word2vec词向量模型转换为词向量;
S3.构建电力技术标准信息提取初始模型;
S4.采用步骤S2得到的词向量,对步骤S3构建的电力技术标准信息提取初始模型进行训练,得到电力技术标准信息提取模型;
S5.将实际的电力技术标准输入到步骤S4得到的电力技术标准信息提取模型,从而得到提取的电力技术标准信息。
步骤S2所述的将步骤S1获取的电力技术标准,采用word2vec词向量模型转换为词向量,具体包括如下步骤:
A.根据步骤S1获取的历史电力技术标准,构建数据集:
设定滑动窗口大小,采用滑动窗口在各个历史电力技术标准的文本上滑动,取中心词作为输入数据,取周边词作为输出数据,构成数据集;
B.将步骤A得到的数据集中的词,转换为one-hot词袋;
C.构建word2vec词向量模型:模型包括输入层、隐藏层和输出层;
D.将步骤B得到的one-hot词袋输入到输入层中,输入层的维度为词典的大小V;将输入层的结果输入到节点数为N的隐藏层中,N为词向量的大小;将隐藏层的结果输入到softmax激活函数中,得到每个周边词的概率;
E.通过最大化中心词生成周边词的条件概率来对word2vec词向量模型进行训练。
步骤E所述的训练,具体为采用如下似然函数进行训练:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网湖南省电力有限公司;国网湖南省电力有限公司信息通信分公司;国家电网有限公司,未经国网湖南省电力有限公司;国网湖南省电力有限公司信息通信分公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211604427.3/2.html,转载请声明来源钻瓜专利网。