[发明专利]基于解耦特征引导的多模态文本页面分类方法在审
申请号: | 202211374707.X | 申请日: | 2022-11-04 |
公开(公告)号: | CN115761757A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 柯逍;许培荣 | 申请(专利权)人: | 福州大学 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/18;G06V10/422;G06V10/56;G06V10/80;G06V10/764;G06V10/82 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈鼎桂;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于解耦特征引导的多模态文本页面分类方法,包括以下步骤:获取电子文本页面数据构建训练集,并基于训练集训练双流的端到端Transformer编码网络,所述双流的端到端Transformer编码网络包括视觉特征提取器、语言特征提取器和跨模态融合编码器;将待分类的电子文本页面的文本数据输入语言特征提取器获得深层语言特征;将待分类的电子文本页面的图像数据输入视觉特征提取器获得深层视觉特征;将得到的深层语言特征和深层视觉特征共同输入跨模态融合编码器获得多模态特征,并用于分类网络进行分类。本发明能够有效地通过多模态方法对电子文本页面进行准确分类。 | ||
搜索关键词: | 基于 特征 引导 多模态 文本 页面 分类 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211374707.X/,转载请声明来源钻瓜专利网。