[发明专利]文本分类方法、装置、设备及存储介质有效
申请号: | 202110569162.7 | 申请日: | 2021-05-25 |
公开(公告)号: | CN113268597B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 杨海钦 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F18/214 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 刘丽华 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分类 方法 装置 设备 存储 介质 | ||
1.一种文本分类方法,其特征在于,所述文本分类方法包括:
当接收到分类请求时,根据所述分类请求获取待分类文本;
计算预设库中每个初始文本与所述待分类文本的相似度,并根据所述相似度从所述预设库中选取目标文本;
对所述待分类文本进行向量化处理,得到待分类向量,并从所述预设库中获取与所述目标文本对应的初始输入向量作为目标向量,所述目标向量的维度大于所述待分类向量的维度;
根据所述待分类向量生成所述待分类文本的第一输出向量,并根据所述待分类向量及所述目标向量生成所述待分类文本的第二输出向量;
从所述预设库中获取与所述目标文本对应的输出向量作为终端输出向量,并根据所述待分类向量、所述终端输出向量、所述第一输出向量及所述第二输出向量生成所述待分类文本的语义向量,包括:对所述第二输出向量进行转置处理,得到转置结果,并计算所述第二输出向量的向量维度;将所述第一输出向量乘以所述转置结果,并将计算后得到的结果除以所述向量维度的平方根,得到所述第一输出向量与所述第二输出向量的注意力分数;对所述注意力分数进行归一化处理,得到注意力概率;获取第二预设矩阵,并从所述预设库中获取第二初始矩阵;将所述第二预设矩阵乘以所述待分类向量,得到第三待拼接向量;将所述第二初始矩阵乘以所述终端输出向量,得到第四待拼接向量;对所述第三待拼接向量及所述第四待拼接向量进行拼接,得到第三输出向量;计算所述注意力概率与预设值的差值,并将所述差值乘以所述第三输出向量,得到所述语义向量;
将所述语义向量输入至预设网络中,得到网络输出向量;
对所述网络输出向量进行映射处理,得到分类结果。
2.如权利要求1所述的文本分类方法,其特征在于,所述计算预设库中每个初始文本与所述待分类文本的相似度包括:
计算所述待分类文本中每个字在所述预设库中的词频,并计算所述待分类文本中每个字在所述预设库中的逆向文件频率;
将所述词频乘以所述逆向文件频率,得到所述待分类文本中每个字的向量值;
确定每个字在所述待分类文本中的位置,并根据所述位置拼接所述向量值,得到所述待分类文本的第一文本向量;
从所述预设库中获取每个初始文本的第二文本向量;
根据余弦公式计算所述第一文本向量与所述第二文本向量的距离,得到所述相似度。
3.如权利要求1所述的文本分类方法,其特征在于,所述根据所述待分类向量及所述目标向量生成所述待分类文本的第二输出向量包括:
获取第一预设矩阵,并从所述预设库中获取第一初始矩阵;
将所述第一预设矩阵乘以所述待分类向量,得到第一待拼接向量;
将所述第一初始矩阵乘以所述目标向量,得到第二待拼接向量;
对所述第一待拼接向量及所述第二待拼接向量进行拼接,得到所述第二输出向量。
4.如权利要求1所述的文本分类方法,其特征在于,在将所述语义向量输入至预设网络中,得到网络输出向量之前,所述方法还包括:
获取训练样本;
构建损失函数;
根据所述训练样本及所述损失函数对初始的Transformer网络进行压缩训练;
监测所述损失函数的取值;
当所述损失函数不再降低时,停止训练,并将当前的Transformer网络确定为所述预设网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110569162.7/1.html,转载请声明来源钻瓜专利网。