[发明专利]神经网络训练方法、成语误用检测方法、装置和电子设备有效
申请号: | 201910821030.1 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110532562B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 杨双涛 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F16/35;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 杨静 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练 方法 成语 误用 检测 装置 电子设备 | ||
本公开提供了一种用于训练神经网络的方法,包括:获取多个语句文本;对于所述多个语句文本中的任一语句文本,从所述任一语句文本中提取成语文本,并获取所述成语文本的语义信息,其中由所述任一语句文本和所述语义信息构成一个样本对;为所述一个样本对添加标签,所述标签表征所述语义信息与所述任一语句文本的语境信息之间是否相适配;以及利用与所述多个语句文本对应的多个带有标签的样本对对所述神经网络进行训练,得到用于检测成语误用的目标神经网络。本公开还提供了一种用于训练神经网络的装置、成语误用检测方法及其装置、以及电子设备。
技术领域
本公开涉及一种用于训练神经网络的方法及其装置、成语误用检测方法及其装置、以及电子设备。
背景技术
成语是汉语经过漫长历史积累的语言精华,虽然多数仅由四个字构成,但其含义却十分丰富,且部分成语有着特定的情感色彩和使用方式。合理的运用成语可以有效提高文章内涵,为文章增色。但在实际应用中,在日常生活使用、各类刊物、网络平台内,存在较多的成语误用,为企业或个人造成不良影响。
发明内容
本公开的一个方面提供了一种用于训练神经网络的方法,包括:获取多个语句文本。对于所述多个语句文本中的任一语句文本,从该任一语句文本中提取成语文本,并获取该成语文本的语义信息,其中由该任一语句文本和所获取的相应的语义信息构成一个样本对。为每个样本对添加标签,标签用于表征一个样本对中的语义信息与语句文本的语境信息之间是否相适配。然后,利用与多个语句文本对应的多个带有标签的样本对对神经网络进行训练,得到用于检测成语误用的目标神经网络。
可选地,神经网络包括第一编码器、第二编码器和分类器。上述利用与多个语句文本对应的多个带有标签的样本对对神经网络进行训练包括:将一个样本对输入至神经网络,由第一编码器和第二编码器分别对该样本对中的语句文本和语义信息进行编码,得到语句表示向量和语义表示向量,再由分类器基于该语句表示向量和语义表示向量输出分类结果。然后,基于分类结果和该样本对的标签确定损失函数是否实现收敛。如果是,则确定训练完成,得到目标神经网络。如果否,则调整神经网络的参数后重复上述对神经网络进行训练的操作,直至损失函数实现收敛。
可选地,上述由分类器基于语句表示向量和语义表示向量输出分类结果包括:对语句表示向量和语义表示向量进行组合,得到第一特征向量。接着对第一特征向量进行全连接映射,得到关于该样本对中的语义信息与语句文本的语境信息之间是否相适配的分类结果。
本公开的另一方面提供了一种成语误用检测方法,包括:获取输入语句文本。获取基于如上所述的用于训练神经网络的方法训练得到的目标神经网络。从输入语句文本中提取输入成语文本,并获取该输入成语文本的语义信息。然后,利用目标神经网络处理该输入语句文本和该输入成语文本的语义信息,得到表征输入成语文本的语义信息与输入语句文本的语境信息之间是否相适配的检测结果。
可选地,目标神经网络包括第一优化编码器、第二优化编码器和分类器。上述利用目标神经网络处理输入语句文本和输入成语文本的语义信息包括:利用第一优化编码器对输入语句文本进行编码,得到输入语句表示向量。利用第二优化编码器对输入成语文本的语义信息进行编码,得到成语语义表示向量。然后,利用优化分类器基于输入语句表示向量和成语语义表示向量进行分类处理,得到检测结果。
可选地,上述利用优化分类器基于输入语句表示向量和成语语义表示向量进行分类处理包括:对输入语句表示向量和成语语义表示向量进行组合,得到第二特征向量。然后,对第二特征向量进行全连接映射,得到检测结果。
可选地,上述对输入语句表示向量和成语语义表示向量进行组合包括:对输入语句表示向量和成语语义表示向量进行拼接。并且/或者,对输入语句表示向量和成语语义表示向量进行指定运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910821030.1/2.html,转载请声明来源钻瓜专利网。