[发明专利]面向高铁智能运维的循环领域自适应知识获取方法在审
申请号: | 202211738153.7 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116304018A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 王健健;王硕 | 申请(专利权)人: | 华北电力大学(保定);河北大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06N3/0442;G06N3/0499;G06N3/096;G06N3/094 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 王临水 |
地址: | 071003 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 智能 循环 领域 自适应 知识 获取 方法 | ||
本发明公开了面向高铁智能运维的循环领域自适应知识获取方法,用于领域知识自适应获取包括:构建领域自适应学习框架;将领域自适应学习框架中实体识别和关系抽取过程转化为分类过程;获取训练文本输入领域自适应学习框架进行训练,得到最优领域自适应学习框架;其中,为完成最优领域自适应学习框架训练过程,定义领域自适应学习框架中部件的损失函数;将实际数据文本输入最优领域自适应学习框架获得目标知识;其中,领域自适应学习框架流程为:对输入文本编码‑共享解码‑第一次分类‑第二次分类。在标注数据数量不足的情况下,可以对海量的高速列车故障文本数据进行自动化知识抽取,构建故障源、故障类别、故障特征等具备知识性的三元组。
技术领域
本发明涉及知识获取技术领域,特别涉及一种面向高铁智能运维的循环领域自适应知识获取方法。
背景技术
在高铁里程增加的同时高速列车的使用年限也在逐渐增加对高速列车的技术保障及运行保养变得更加重要,作为提升系统运行可靠性和安全性的有效方案之一,国内外研究人员围绕高速列车信息控制系统及其各子系统的实时故障诊断和检测开展了大量的研究。但是,大多数研究集中于实时故障分类问题,而这些数据中包含的相关知识和规律并没有被充分利用起来。在实际的系统运行过程中,积累了大量的故障数据和故障描述文本,这使从相关文本中提取运行维护知识成为了必然选择,同时也使进一步管理和运用此类知识成为了可能。
随着深度学习技术的发展,大多数机器学习算法常常被批评为难以应用于没有足够标注信息的新任务或数据集中去,这也带来了小样本或零样本学习等方法的兴起,而领域自适应(DA,Domain Adaptation)方法则是通过建立从带有标注的源领域到未标注或稀疏标注的目标领域的知识迁移来解决这一问题。现在主流的领域自适应方法一般分为三种:有监督的领域自适应(SDA)、无监督的领域自适应(UDA)和半监督的领域自适应(SSDA)。有监督的领域自适应一般假设目标域中存在一些带标签的数据,而执行DA算法时只使用带标签的数据来进行迁移学习;与此相反,无监督的领域自适应不需要任何目标数据标签,但是它们需要大量未标记的目标数据来对齐不同域之间的分布;半监督的领域自适应则是指对目标数据进行较少的标注,同时利用未标注和已标注的目标域数据来完成从源域到目标域的知识迁移。
典型的DA方法是将源域和目标域的数据嵌入到一个公共的嵌入式表示空间中,并在两个域之间对齐其边缘概率分布。一般有两种策略来实现这种对齐:一个是利用对抗训练;另一个是直接最小化两个分布之间的距离。这两种方法都可以对输入数据生成具有领域不变性的特征表示,并利用源域的特征表示训练分类器,然后将分类器推广到目标域。
前者是依据对抗学习的思想和理论,主要是训练一个域分类器来区分输入特征是来自源域还是目标域,而同时也要训练一个特征编码器,通过它来产生无法区分的特征表示来欺骗这个域分类器。此类方法一般会利用梯度反转的方式来最大化域判别的损失;有些方法则是在共享特征空间中强制执行这些对抗性损失,同时为每个域学习一个私有特征空间以避免学习到的共享表示带来干扰;更进一步的改进是同时对齐源域与目标域间的边缘分布与条件分布。
后者主要是根据距离度量来衡量源分布和目标分布之间的距离,一个常用的距离度量是最大均值差(Maximum Mean Discrepancy,MMD),它可以计算再生核Hilbert空间(RKHS)中两个域均值差的范数,也有使用深度自适应网络(DAN)或者基于其产生的变体,它们会将MMD应用于最后一个完全连接的层,以匹配两个分布的高阶统计量。然而,由于源域和目标域之间的条件概率分布可能不同,仅调整边缘分布并不足以保证DA的成功。此外,这种策略仅仅考虑到了不同领域间的差异,却并没有考虑不同领域之间存在的类别差异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学(保定);河北大学,未经华北电力大学(保定);河北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211738153.7/2.html,转载请声明来源钻瓜专利网。