[发明专利]一种处理方法以及装置在审
申请号: | 202210238777.6 | 申请日: | 2022-03-11 |
公开(公告)号: | CN114742053A | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 胡家豪;刘欣然 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 高天华;胡春光 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 处理 方法 以及 装置 | ||
1.一种处理方法,其中,所述方法包括:
获取包含至少一个待处理词语的待处理文本;
对所述待处理文本进行特征提取,得到文本特征信息;
从图网络中获取具备关联关系的至少两种类别的词语的类别特征信息;
基于所述类别特征信息对所述文本特征信息进行处理,得到至少一种类别的所述待处理词语的位置信息。
2.根据权利要求1所述的方法,其中,所述基于所述类别特征信息对所述文本特征信息进行处理,得到至少一种类别的所述待处理词语的位置信息,包括:
基于所述类别特征信息,确定处理模型的特征融合模块的特征融合权重;
通过所述特征融合模块,基于所述特征融合权重对所述文本特征信息进行处理,得到至少一种类别的所述待处理词语的位置信息。
3.根据权利要求2所述的方法,其中,所述通过所述特征融合模块,基于所述特征融合权重对所述文本特征信息进行处理,得到至少一种类别的所述待处理词语的位置信息,包括:
从所述类别特征信息中确定目标类别的目标特征信息;
通过所述特征融合模块,基于与所述目标特征信息关联的特征融合权重,对所述文本特征信息进行处理,得到所述目标类别的待处理词语的位置信息。
4.根据权利要求2所述的方法,其中,所述基于所述类别特征信息,确定处理模型的特征融合模块的特征融合权重,包括:
基于所述类别特征信息对所述文本特征信息进行处理,确定所述特征融合权重。
5.根据权利要求2所述的方法,其中,所述从图网络中获取具备关联关系的至少两种类别的词语的类别特征信息,包括:
通过所述处理模型的图特征提取模块,对所述图网络进行处理,获取所述类别特征信息。
6.根据权利要求5所述的方法,其中,所述通过所述处理模型的图特征提取模块,对所述图网络进行处理,获取所述类别特征信息,包括:
通过所述图特征提取模块的图嵌入单元,对所述图网络中的类别信息以及各个类别之间的关联关系进行量化,得到所述图网络的初始类别特征信息以及关联关系信息;
通过所述图特征提取模块的图编码单元,基于所述关联关系信息,对所述初始类别特征信息进行处理,获取所述类别特征信息。
7.根据权利要求2所述的方法,其中,所述对所述待处理文本进行特征提取,得到文本特征信息,包括:
通过所述处理模型的文本编码单元,对所述待处理词语进行量化,得到文本量化结果;
通过第一文本提取单元对所述文本量化结果进行特征提取,得到所述文本特征信息。
8.根据权利要求2所述的方法,其中,所述对所述待处理文本进行特征提取,得到文本特征信息,包括:
通过所述处理模型的第二文本提取单元,对所述待处理词语以及所述待处理词语的上下文信息进行分析,得到所述文本特征信息。
9.根据权利要求1至8任一所述的方法,其中,所述方法还包括:
基于所述待处理文本确定语料样本;
基于所述语料样本中包含的类别信息,确定所述图网络。
10.一种处理装置,包括:
获取模块,用于获取包含至少一个待处理词语的待处理文本;
提取模块,用于对所述待处理文本进行特征提取,得到文本特征信息;
所述获取模块,还用于从图网络中获取具备关联关系的至少两种类别的词语的类别特征信息;
处理模块,用于基于所述类别特征信息对所述文本特征信息进行处理,得到至少一种类别的所述待处理词语的位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210238777.6/1.html,转载请声明来源钻瓜专利网。