[发明专利]面向高铁智能运维的循环领域自适应知识获取方法在审
申请号: | 202211738153.7 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116304018A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 王健健;王硕 | 申请(专利权)人: | 华北电力大学(保定);河北大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06N3/0442;G06N3/0499;G06N3/096;G06N3/094 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 王临水 |
地址: | 071003 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 智能 循环 领域 自适应 知识 获取 方法 | ||
1.面向高铁智能运维的循环领域自适应知识获取方法,其特征在于,包括以下步骤:
构建领域自适应学习框架;
将所述领域自适应学习框架中实体识别和关系抽取过程转化为分类过程;
获取训练文本输入所述领域自适应学习框架进行训练,得到最优领域自适应学习框架;其中,为完成所述最优领域自适应学习框架训练过程,定义所述领域自适应学习框架中所述部件的损失函数;
将实际数据文本输入所述最优领域自适应学习框架获得目标知识;
其中,所述领域自适应学习框架流程为:对输入文本编码-共享解码-第一次分类-第二次分类。
2.根据权利要求1所述的面向高铁智能运维的循环领域自适应知识获取方法,其特征在于,对输入文本进行编码为采用预构建的编码器进行编码;
其中,所述编码器包括:编码器Ec、编码器Ed;
所述编码器Ec和所述编码器Ed为利用多层感知机或长短时记忆网络构建的;
利用所述编码器Ec对所述输入文本进行编码得到通用表示编码Rc;
利用所述编码器Ed对所述输入文本进行编码得到相关表示编码Rd。
3.根据权利要求1所述的面向高铁智能运维的循环领域自适应知识获取方法,其特征在于,所述第一次分类和所述第二次分类均采用预构建的分类器进行分类;
其中,所述分类器包括:分类器Cd、分类器Cc。
利用所述分类器Cd对所述输入样本的领域类别进行分类;
利用所述分类器Cc对所述输入样本数据本身的类别进行判断。
4.根据权利要求1所述的面向高铁智能运维的循环领域自适应知识获取方法,其特征在于,所述共享解码过程采用共享解码器Dcd进行解码处理;
所述共享解码器Dcd是同时利用领域无关表示zc和领域相关表示zd共同构建一个新的联合的数据表示zc+zd,其定义如下:
其中,θcd是解码器Dcd的相关参数;
其中,所述共享编码器的损失函数采用均方误差进行定义,其表达式如下:
其中,C为输入X的维数,N为源域和目标域总的输入样例的数量,xi代表第i个样例,λcd为损失函数的超参数,‖‖为二范数的平方。
5.根据权利要求1所述的面向高铁智能运维的循环领域自适应知识获取方法,其特征在于,还包括:为了控制领域无关的特征表示与领域相关的特征表示间的冗余表示,引入正交约束机制来激励两个编码器对同一个输入沿不同方向进行编码,其损失函数定义如下:
其中,Hc表示一个无关矩阵,每一行是一个样例的领域无关特征表示;Hd表示一个相关矩阵,每一行是一个样例的领域相关特征表示;λd表示一个比例因子。
6.根据权利要求3所述的面向高铁智能运维的循环领域自适应知识获取方法,其特征在于,所述分类器Cd的损失函数定义表达式为:
其中,di是第i个样例的领域类别标签的one-hot编码,λclass表示一个比例因子,θclass为分类器Cd的相关参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学(保定);河北大学,未经华北电力大学(保定);河北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211738153.7/1.html,转载请声明来源钻瓜专利网。