[发明专利]文本处理方法以及装置在审
申请号: | 202310401259.6 | 申请日: | 2023-04-14 |
公开(公告)号: | CN116483965A | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 谢春梅;王航;黄文亢;王洪彬 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F18/213;G06F18/25;G06Q40/08 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 310013 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 处理 方法 以及 装置 | ||
1.一种文本处理方法,包括:
根据目标事件对应的业务文本生成文本片段,并将所述文本片段输入至文本处理模型,其中,所述文本处理模型包括初始化单元、提取单元、交换单元以及处理单元;
针对所述文本片段添加标识信息,并通过所述初始化单元对添加所述标识信息的文本片段进行初始化处理,获得中间片段特征;
通过所述提取单元提取所述中间片段特征的目标特征,并通过所述交换单元对所述目标特征中的目标标识信息进行信息交换处理,根据处理结果确定目标片段特征;
通过所述处理单元对所述目标片段特征进行处理,获得所述目标事件的事件决策信息。
2.根据权利要求1所述的方法,所述根据目标事件对应的业务文本生成文本片段,并将所述文本片段输入至文本处理模型,包括:
接收针对所述目标事件提交的所述业务文本;
按照预设长度阈值和文本切分规则对所述业务文本进行切分,获得所述文本片段;
将所述文本片段输入至所述文本处理模型。
3.根据权利要求1所述的方法,所述针对所述文本片段添加标识信息,并通过所述初始化单元对添加所述标识信息的文本片段进行初始化处理,获得中间片段特征,包括:
在所述文本处理模型中确定预设的标识信息,并将所述标识信息添加至所述文本片段的字符起始位;
将携带有所述标识信息的文本片段输入至所述初始化单元进行初始化处理,获得所述中间片段特征;
其中,所述中间片段特征基于所述标识信息对应的标识特征和所述文本片段对应的片段特征确定。
4.根据权利要求1所述的方法,所述通过所述提取单元提取所述中间片段特征的目标特征,并通过所述交换单元对所述目标特征中的目标标识信息进行信息交换处理,根据处理结果确定目标片段特征,包括:
将所述中间片段特征输入至所述提取单元进行特征提取处理,获得所述文本片段对应的目标特征;
在所述目标特征中提取所述标识信息对应的目标标识信息,以及所述文本片段对应的目标文本片段特征;
将所述目标标识信息输入至所述交换单元进行信息交换处理,获得全局标识信息;
根据所述全局标识信息和所述目标文本片段特征生成所述目标片段特征。
5.根据权利要求4所述的方法,所述将所述目标标识信息输入至所述交换单元进行信息交换处理,获得全局标识信息,包括:
将所述目标标识信息输入至所述交换单元,通过所述交换单元中的注意力层生成自注意力矩阵,以及通过所述交换单元中的相似度计算层生成相似度矩阵;
根据所述自注意力矩阵和所述相似度矩阵,确定所述目标标识信息对应的权重矩阵,并根据所述权重矩阵生成所述目标标识信息对应的全局标识信息。
6.根据权利要求4或5所述的方法,所述通过所述处理单元对所述目标片段特征进行处理,获得所述目标事件的事件决策信息,包括:
将所述目标片段特征输入至所述处理单元,通过所述处理单元中的池化层对所述目标片段特征中的全局标识信息进行平均池化处理,获得所述文本片段对应的文本片段特征;
通过所述处理单元中的特征处理层对所述文本片段特征进行处理,根据处理结果确定所述目标事件的事件决策信息。
7.根据权利要求6所述的方法,所述通过所述处理单元中的特征处理层对所述文本片段特征进行处理,根据处理结果确定所述目标事件的事件决策信息,包括:
将所述文本片段特征输入至所述处理单元中的特征处理层进行融合处理,获得所述业务文本对应的长文本特征;
将所述长文本特征输入至所述处理单元中的全连接层进行类别分析,获得所述目标事件的事件决策信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310401259.6/1.html,转载请声明来源钻瓜专利网。