[发明专利]一种电力营销专业词识别方法及系统在审

专利信息
申请号: 201910584443.2 申请日: 2019-07-01
公开(公告)号: CN110287495A 公开(公告)日: 2019-09-27
发明(设计)人: 邹云峰;邓君华;徐超;季梦黎 申请(专利权)人: 国网江苏省电力有限公司电力科学研究院;国家电网有限公司;国网江苏省电力有限公司;江苏省电力试验研究院有限公司
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 史俊军
地址: 210000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 电力营销 专业词 构建 标注 模型预测结果 背景语料 工作效率 外部数据 准确率 迭代 抽取 并用 输出 响应
【说明书】:

发明公开了一种电力营销专业词识别方法,包括步骤1,基于电力营销外部数据,训练初始识别模型;抽取电力营销数据中的专业词,构建初始专业词词典;步骤2,基于最新的专业词词典和识别模型,对电力营销数据中的词进行标注,并用标注好的电力营销数据,训练新的识别模型;步骤3,响应于迭代次数小于阈值,基于新的识别模型对电力营销数据进行识别,构建新的专业词词典,转至步骤2,否则,输出新的识别模型用于专业词识别。同时公开了相应的系统。本方法针对在没有大量背景语料的基础上,通过识别模型预测结果回标,提升对针对电力营销数据的专业词识别准确率,提高电力人员的工作效率。

技术领域

本发明涉及一种电力营销专业词识别方法及系统,属于中文信息处理技术领域。

背景技术

随着电子信息化的发展,电力数据成倍增加,电力营销数据中存在着大量重要信息。电力营销专业词识别是电力领域中一项基础而又关键性的任务,通过对营销数据的专业词抽取,可以发现隐藏在数据背后的信息,比如故障检测以及预防,市场运营情况等。

目前针对电力领域的专业词识别主要采用两种方式进行抽取,一种是基于统计学方法,计算词与词之间的相关性进行抽取,该方法偏重出现次数较多的术语,准确率较低;另一种采用深度学习算法,该方法需要大量的人工标注数据,使得工作人员的工作量大且效率较低。

发明内容

本发明提供了一种电力营销专业词识别方法及系统,解决了现有识别技术存在的上述问题。

为了解决上述技术问题,本发明所采用的技术方案是:

一种电力营销专业词识别方法,包括以下步骤,

步骤1,基于电力营销外部数据,训练初始识别模型;抽取电力营销数据中的专业词,构建初始专业词词典;

步骤2,基于最新的专业词词典和识别模型,对电力营销数据中的词进行标注,并用标注好的电力营销数据,训练新的识别模型;

步骤3,响应于迭代次数小于阈值,基于新的识别模型对电力营销数据进行识别,构建新的专业词词典,转至步骤2,否则,输出新的识别模型用于专业词识别。

识别模型为加入自注意力机制的BILSTM-CRF模型。

构建初始专业词词典的过程为,

采用左右信息熵和K-Means聚类方法抽取电力营销数据中的专业词;

将所有方法抽取的结果和外部电力业务人员提供的领域词典合并,经过人工过滤后得到初始专业词词典。

对电力营销数据中的专业词进行标注的过程为,

用识别模型识别电力营销数据,对电力营销数据中的词进行标注;

将标注为非实体的词在专业词词典内查找,若存在,则将标注为非实体的词标注为专业词。

根据专业词词典,构建Trie树,通过Trie树查找标注为非实体的词;其中,Trie树中每个节点表示专业词词典中的每个字,根节点不存放任何字。

一种电力营销专业词识别系统,包括,

构建模块:基于电力营销外部数据,训练初始识别模型;抽取电力营销数据中的专业词,构建初始专业词词典;

标注训练模块:基于最新的专业词词典和识别模型,对电力营销数据中的词进行标注,并用标注好的电力营销数据,训练新的识别模型;

回标模块:响应于迭代次数小于阈值,基于新的识别模型对电力营销数据进行识别,构建新的专业词词典,转至标注训练模块,否则,输出新的识别模型用于专业词识别。

识别模型为加入自注意力机制的BILSTM-CRF模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司电力科学研究院;国家电网有限公司;国网江苏省电力有限公司;江苏省电力试验研究院有限公司,未经国网江苏省电力有限公司电力科学研究院;国家电网有限公司;国网江苏省电力有限公司;江苏省电力试验研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910584443.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top