[发明专利]一种文本纠错方法、装置、电子设备和介质有效
申请号: | 202210371375.3 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114462356B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 李晓川;赵雅倩;李仁刚;郭振华;范宝余 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/232;G06K9/62;G06V10/74 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张倩 |
地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 纠错 方法 装置 电子设备 介质 | ||
1.一种文本纠错方法,其特征在于,包括:
对获取的待分析图像进行图像编码,得到图像特征;
对获取的带噪文本进行文本编码,得到文本特征;
按照设定的注意力机制,对所述图像特征和所述文本特征进行特征对比,得到纠错信号;
利用训练好的解码器依据所述纠错信号对初始文本标签进行预测,得到纠错后的文本信息;
所述注意力机制包括自注意力机制和跨注意力机制;
所述按照设定的注意力机制,对所述图像特征和所述文本特征进行特征对比,得到纠错信号包括:
按照所述自注意力机制,对所述图像特征和所述文本特征进行关联性分析,得到对齐特征;其中,所述对齐特征包括所述图像特征和所述文本特征的对应关系;
按照所述自注意力机制和所述跨注意力机制,对所述对齐特征和所述文本特征进行分析,得到纠错信号;跨注意力机制包括利用归一化指数函数对对齐特征的自注意力向量和文本特征的自注意力向量进行处理。
2.根据权利要求1所述的文本纠错方法,其特征在于,所述按照所述自注意力机制,对所述图像特征和所述文本特征进行关联性分析,得到对齐特征包括:
按照如下公式,确定出所述图像特征和所述文本特征的自注意力向量;其中,所述自注意力向量包含所述图像特征的每维特征与所述文本特征的每维特征的关联特征;
;
其中,,
对所述自注意力向量进行层归一化和相加处理,得到对齐特征。
3.根据权利要求1所述的文本纠错方法,其特征在于,所述按照所述自注意力机制和所述跨注意力机制,对所述对齐特征和所述文本特征进行分析,得到纠错信号包括:
按照所述自注意力机制,对所述对齐特征进行注意力分析,得到所述对齐特征的自注意力特征;
按照所述自注意力机制,对所述文本特征进行注意力分析,得到所述文本特征的自注意力特征;
按照如下公式,确定出所述对齐特征的自注意力特征和所述文本特征的自注意力特征之间的跨注意力向量,
;
其中,
对所述跨注意力向量进行层归一化、相加和纠错处理,得到纠错信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210371375.3/1.html,转载请声明来源钻瓜专利网。