[发明专利]电力计量的命名实体识别方法、装置和计算机设备在审
申请号: | 202110837584.8 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113591479A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 梁洪浩;伍少成;姜和芳;陈晓伟 | 申请(专利权)人: | 深圳供电局有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/284;G06F16/36;G06N3/04 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 周清华 |
地址: | 518021 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电力 计量 命名 实体 识别 方法 装置 计算机 设备 | ||
1.一种电力计量的命名实体识别方法,其特征在于,所述方法包括:
获取用于描述电力计量信息的待识别语料中多个词语各自对应的词向量;
将多个词向量输入到训练好的编码器,通过所述编码器获取每个词向量对应的高斯分布的分布特征;
基于多个词向量对应的分布特征,生成词向量特征;
将所述词向量特征输入到预设的条件随机场,根据所述条件随机场输出的标注结果,确定所述待识别语料中的命名实体。
2.根据权利要求1所述的方法,其特征在于,所述基于多个词向量对应的分布特征,生成词向量特征,包括:
对多个词向量对应的分布特征进行组合,生成第一参考特征集合和第二参考特征集合;所述第一参考特征集合中的每个元素为一词向量;所述第二参考特征集合中的每个元素为相邻的词向量对;
将所述第一参考特征集合和第二参考特征集合输入到训练好的双向长短时记忆网络,通过所述双向长短时记忆网络获取所述第一参考特征集合对应的独立特征和所述第二参考集合对应的关联性特征;
对所述独立特征和所述关联性特征进行特征融合,得到词向量特征。
3.根据权利要求2所述的方法,其特征在于,所述对多个词向量对应的分布特征进行组合,生成第二参考特征集合,包括:
确定多个分布特征对应的排列顺序;所述排列顺序与待识别语料中各个词语的排列顺序对应;
根据所述排列顺序,获取多组相邻的分布特征,得到多组分布特征对;
采用多组分布特征对生成第二参考特征集合。
4.根据权利要求1所述的方法,其特征在于,还包括:
获取预先构建的电力计量语料库;所述电力计量语料库包括多条用于描述电力计量信息的语料;
采用预设的分词模型对电力计量语料库中的语料进行分词,得到多个用于描述电力计量信息的词语;
基于得到的多个词语对初始化的词向量模型进行训练,得到训练好的词向量模型,所述训练好的词向量模型用于获取电力计量语料中词语对应的词向量。
5.根据权利要求4所述的方法,其特征在于,还包括:
通过训练好的词向量模型,获取用于描述电力计量信息的多个词语各自对应的第一词向量;
将所述第一词向量输入到待训练的编码器,通过所述编码器获取所述第一词向量对应高斯分布的第一分布特征;
将所述第一分布特征输入到待训练的解码器,通过所述解码器基于所述第一分布特征获取预测词向量;
基于所述第一词向量、预测词向量和损失函数,调整所述编码器和解码器的参数,直到满足训练结束条件,得到训练好的编码器和解码器。
6.根据权利要求2所述的方法,其特征在于,还包括:
获取样本语料及其对应的标签;所述标签包括所述样本语料中电力计量的命名实体和所述命名实体对应的实体类别;
采用训练好的分词模型对所述样本语料分词,获取分词后多个词语各自对应的第二词向量,并通过训练好的编码器获取所述第二词向量对应的第二分布特征;
对多个第二分布特征进行组合,生成第一样本特征集合和第二样本特征集合,并将所述第一样本特征集合和第二样本特征集合输入到待训练的双向长短时记忆网络,获取对应的词向量特征;
将所述词向量特征输入到预设的条件随机场,根据所述条件随机场输出的预测结果和所述标签,调整所述双向长短时记忆网络对应的网络参数,直到满足训练结束条件,得到训练好的双向长短时记忆网络。
7.根据权利要求6所述的方法,其特征在于,所述根据所述条件随机场输出的预测结果和所述标签,调整所述双向长短时记忆网络对应的网络参数,包括:
通过所述条件随机场基于所述词向量特征确定每个词向量特征对应的预测结果和所述预测结果对应的预测得分;
根据多个词向量对应的预测得分和预设的势函数,确定当前的条件概率;
当所述条件概率小于预设概率阈值时,根据所述预测结果和所述标签调整所述双向长短时记忆网络对应的网络参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳供电局有限公司,未经深圳供电局有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110837584.8/1.html,转载请声明来源钻瓜专利网。