[发明专利]自然语言处理方法、设备、存储介质及程序产品在审
申请号: | 202111277465.8 | 申请日: | 2021-10-29 |
公开(公告)号: | CN113919325A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 岳文浩;杨善松 | 申请(专利权)人: | 海信视像科技股份有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06N3/04;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 马明明;臧建明 |
地址: | 266555 山东省青岛*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 处理 方法 设备 存储 介质 程序 产品 | ||
1.一种自然语言处理方法,其特征在于,包括:
获取目标文本;
将所述目标文本输入自然语言处理NLP模型,得到目标处理结果;所述目标处理结果包括各标签及分别对应的概率值;
将所述目标文本输入置信度模型,得到所述目标处理结果对应的置信度;所述置信度与所述各标签的概率值的分布相关;
根据所述置信度,对所述目标处理结果进行处理。
2.根据权利要求1所述的方法,其特征在于,所述目标处理结果为分类结果或序列标注结果。
3.根据权利要求1所述的方法,其特征在于,所述根据所述置信度,对所述目标处理结果进行处理,包括:
若所述置信度大于预设阈值,则根据所述目标处理结果输出最终结果。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述将所述目标文本输入自然语言处理NLP模型之前,还包括:
通过第一样本集对第一待训练模型进行训练,得到所述NLP模型;
将第二样本集中各第二样本及所述各第二样本分别对应的标注结果输入所述NLP模型,得到处理结果预测值;
根据所述处理结果预测值和所述第二样本集对第二待训练模型进行训练,得到所述置信度模型。
5.根据权利要求4所述的方法,其特征在于,所述通过第一样本集对所述第一待训练模型进行训练,得到所述NLP模型,包括:
将所述第一样本集中各第一样本及所述各第一样本分别对应的标注结果输入所述第一待训练模型;
通过梯度下降算法,对所述第一待训练模型的参数进行更新,得到所述NLP模型。
6.根据权利要求4所述的方法,其特征在于,所述根据所述处理结果预测值和所述第二样本集对所述第二待训练模型进行训练,得到所述置信度模型,包括:
将所述第二样本集中各第二样本及所述各第二样本分别对应的标注结果输入所述第二待训练模型,得到所述处理结果预测值对应的置信度预测值;
根据损失函数,通过梯度下降算法对所述第二待训练模型的参数进行更新,得到所述置信度模型;所述损失函数是根据所述处理结果预测值和所述置信度预测值构建的。
7.根据权利要求6所述的方法,其特征在于,所述损失函数包括概率约束项和概率分布约束项,所述概率约束项与所述处理结果预测值中各第二样本分别在真实标签的概率预测值与对应的置信度预测值之间的差值相关;所述概率分布约束项与所述处理结果预测值中各第二样本的各标签的标注结果与概率预测值之间的差值相关。
8.根据权利要求4所述的方法,其特征在于,所述NLP模型包括依次连接的嵌入层、表征层和第一输出层;所述第二待训练模型包括所述NLP模型的嵌入层、表征层,以及与所述表征层连接的第二输出层。
9.根据权利要求8所述的方法,其特征在于,所述表征层为变换器模型Transformer或双向长短时记忆模型Bi-LSTM。
10.一种自然语言处理设备,其特征在于,包括:
获取模块,用于获取目标文本;
第一输入模块,用于将所述目标文本输入自然语言处理NLP模型,得到目标处理结果;所述目标处理结果包括各标签及分别对应的概率值;
第二输入模块,用于将所述目标文本输入置信度模型,得到所述目标处理结果对应的置信度;所述置信度与所述各标签的概率值的分布相关;
处理模块,用于根据所述置信度,对所述目标处理结果进行处理。
11.一种自然语言处理设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至9任一项所述的自然语言处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信视像科技股份有限公司,未经海信视像科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111277465.8/1.html,转载请声明来源钻瓜专利网。