[发明专利]特征融合模型的训练、文本处理方法及装置有效
申请号: | 202111490459.0 | 申请日: | 2021-12-08 |
公开(公告)号: | CN114065768B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 吕乐宾;王洪斌;权佳成 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 徐晨影 |
地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 融合 模型 训练 文本 处理 方法 装置 | ||
本说明书实施例公开了一种特征融合模型的训练和文本处理方法、装置,用以实现全面准确的文本嵌入,提高文本处理过程中对文本语义理解的准确性。所述特征融合模型的训练方法包括:获取第一样本字符在N个维度的特征信息;分别对得到的N个特征信息进行嵌入处理;依次将N个嵌入向量输入特征融合模型中,输出第一样本字符的M个表示向量,特征融合模型包括M级融合网络,第一级融合网络用于对输入的嵌入向量进行融合处理得到对应的表示向量;非第一级融合网络用于对输入的嵌入向量和上一级融合网络对应的表示向量进行融合处理得到对应的表示向量;基于各级融合网络对应的表示向量和输入至各级融合网络的嵌入向量,更新各级融合网络的网络参数。
技术领域
本申请涉及计算机技术领域,尤其涉及一种特征融合模型的训练、文本处理方法及装置。
背景技术
在进行文本处理时,通常需要先对待处理的文本进行文本嵌入,即将文本中的字符(比如中文对应的汉字、英文对应的单词等)转换为计算机可以识别的数值型词向量。文本嵌入结果的好坏大大影响文本处理过程中对文本语义的理解。
目前常见的文本嵌入方案,主要是基于深度学习技术,利用神经网络对大型语料中的字符的语义进行学习,输出一串语义向量来表示字符的语义。但是,这种方案只能针对文本中的字符在实际文本中的语义来刻画文本,这就造成对文本的刻画较为单一,进而导致后续文本处理过程中对文本语义的理解不准确,影响文本处理结果的准确性。
发明内容
本申请提供一种特征融合模型的训练方法、文本处理方法及装置,用于提高文本处理过程中对文本语义理解的准确性,进而提高文本处理结果的准确性。
第一方面,本申请提供一种特征融合模型的训练方法,包括:
获取第一样本文本中的第一样本字符在N个维度的特征信息,得到N个特征信息,所述N个特征信息与所述N个维度一一对应,所述N为大于1的整数;
分别对所述N个特征信息进行嵌入处理,得到N个嵌入向量,每个嵌入向量用于表示所述第一样本字符在对应维度的嵌入向量;
将所述N个嵌入向量输入特征融合模型中,输出所述第一样本字符的M个表示向量,所述M为正整数;其中,所述特征融合模型包括M级融合网络,所述M级融合网络与所述M个表示向量一一对应,若融合网络为第一级融合网络,融合网络用于对输入的嵌入向量进行融合处理得到对应的表示向量;若融合网络不为第一级融合网络,融合网络用于对输入的嵌入向量和上一级融合网络对应的表示向量进行融合处理得到对应的表示向量;
基于各级融合网络对应的表示向量和输入至各级融合网络的嵌入向量,更新各级融合网络的网络参数。
可以看出,在本申请实施例中,由于使用了文本中的字符在多个维度的特征信息进行嵌入,使得特征融合模型能够从多个维度去学习了解文本,进而输出的表示向量能够更全面、更丰富地刻画文本的语义;另外,由于多个维度的特征信息是有层次地、逐步输入到特征融合模型中进行融合处理的,使得特征融合模型能够在对当前输入的嵌入向量有了一定的学习了解之后再继续对下一个嵌入向量进行学习了解,进而使得特征融合模型能够循序渐进地获取信息、理解信息及认知信息,保留各维度的重要特征并进行有效结合,相较于将多个维度的特征信息混杂在一起同时进行融合处理,本方案的特征融合模型输出的表示向量能够更准确地刻画文本的语义。
第二方面,本申请提供一种文本处理方法,包括:
获取待处理文本的目标字符在N个维度的特征信息,得到N个特征信息,所述N个特征信息与所述N个维度一一对应,所述N为大于1的整数;
分别对所述N个特征信息进行嵌入处理,得到N个嵌入向量,每个嵌入向量用于表示所述目标字符在对应维度的嵌入向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111490459.0/2.html,转载请声明来源钻瓜专利网。