[发明专利]自然语言处理方法、装置及存储介质在审
申请号: | 202011152152.5 | 申请日: | 2020-10-23 |
公开(公告)号: | CN112270184A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 朱威;李恬静 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/33;G06K9/62;G06N3/04 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 处理 方法 装置 存储 介质 | ||
本申请涉及医疗科技技术领域,具体公开了一种自然语言处理方法、装置及存储介质。该方法包括:获取文本样本;对所述文本样本进行分词,得到至少一个词语;从预先构造的语义知识库中获取所述至少一个词语中每个词语对应的词素,并将所述每个词语对应的词素作为所述每个词语中的每个单词的监督标签;将所述文本样本输入网络模型,得到所述文本样本中每个单词的第一词素;根据所述文本样本中每个单词的监督标签以及第一词素,调整所述网络模型的网络参数,得到预训练网络模型;使用所述预训练网络模型进行自然语言处理。本申请有利于提高自然语言处理的精度。
技术领域
本申请涉及人工智能技术领域,具体涉及一种自然语言处理方法、装置及存储介质。
背景技术
随着人工智能技术的长足发展,在自然语言处理领域已经取得了较好的处理效果,给人们生活带来了极大的便利。比如,使用训练好的语言处理模型,对用户在对话框中输入的文本进行纠错,从而正确的表达出用户的意图,再如,在人机对话中,比如siri语音,通过训练好的语言处理对用户的口语进行理解,进而执行用户的意图。
虽然,现有训练出的不同的语言处理模型能够执行不同的自然语言处理任务,但是在训练的过程中仅仅依赖语言的字面语义进行训练,未能挖掘出语言的潜在语义,导致自然语言处理过程中的处理精度比较低。
发明内容
本申请实施例提供了一种自然语言处理方法、装置及存储介质。通过融入每个词语的词素信息,可挖掘语言的潜在语义,提高自然语言的处理进度。
第一方面,本申请实施例提供一种自然语言处理方法,包括:
获取文本样本;
对所述文本样本进行分词,得到至少一个词语;
从预先构造的语义知识库中获取所述至少一个词语中每个词语对应的词素,并将所述每个词语对应的词素作为所述每个词语中的每个单词的监督标签;
将所述文本样本输入网络模型,得到所述文本样本中每个单词的第一词素;
根据所述文本样本中每个单词的监督标签以及第一词素,调整所述网络模型的网络参数,得到预训练网络模型;
使用所述预训练网络模型进行自然语言处理。
第二方面,本申请实施例提供一种自然语言处理装置,包括:
获取单元,用于获取文本样本;
处理单元,用于对所述文本样本进行分词,得到至少一个词语;
所述处理单元,还用于从预先构造的语义知识库中获取所述至少一个词语中每个词语对应的词素,并将所述每个词语对应的词素作为所述每个词语中的每个单词的监督标签;
所述处理单元,还用于将所述文本样本输入网络模型,得到所述文本样本中每个单词的第一词素;
所述处理单元,还用于根据所述文本样本中每个单词的监督标签以及第一词素,调整所述网络模型的网络参数,得到预训练网络模型;
所述处理单元,还用于使用所述预训练网络模型进行自然语言处理。
第三方面,本申请实施例提供一种自然语言处理装置,包括处理器、存储器、通信接口以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如第一方面所述的方法中的步骤的指令。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序使得计算机执行如第一方面所述的方法。
第五方面,本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机可操作来使计算机执行如第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011152152.5/2.html,转载请声明来源钻瓜专利网。