[发明专利]基于神经网络的文本处理方法和文本处理装置在审
申请号: | 201810757854.2 | 申请日: | 2018-07-11 |
公开(公告)号: | CN110781659A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 郭垿宏;郭心语;李安新;陈岚 | 申请(专利权)人: | 株式会社NTT都科摩 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06N3/04 |
代理公司: | 11105 北京市柳沈律师事务所 | 代理人: | 于小宁 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 文本处理 预处理结果 输入文本 输出层 输入层 中间层 文本处理装置 输出文本 分析 | ||
1.一种基于神经网络的文本处理方法,所述神经网络包括至少一个文本处理层,所述至少一个文本处理层包括输入层、中间层和输出层,所述方法包括:
所述输入层获取输入文本;
所述中间层利用多种不同的处理方法对所述输入文本进行分析,获取对应于所述多种不同的处理方法的多种预处理结果;以及
所述输出层基于所述多种预处理结果,生成并且输出文本处理结果。
2.根据权利要求1所述的文本处理方法,其中,所述中间层利用多种不同的处理方法对所述输入文本进行分析,获取对应于所述多种不同的处理方法的多种预处理结果包括:
所述多种不同的处理方法中的每一种对所述输入文本的所有组成句子进行分析,获取所有组成句子的每一个的句子权重,作为所述预处理结果。
3.根据权利要求2所述的文本处理方法,其中,所述输出层基于所述多种预处理结果,生成并且输出文本处理结果包括:
所述输出层基于所述多种不同的处理方法中的每一种的处理方法权重以及所述多种预处理结果,提取所有组成句子中的预定数目的句子作为所述文本处理结果。
4.根据权利要求1到3的任一项所述的文本处理方法,其中,所述神经网络包括N个级联的文本处理层,N≥2,
所述N个级联的文本处理层中的第n个文本处理层接收第(n-1)个文本处理层输出的输出文本处理结果作为输入文本,1<n≤N。
5.根据权利要求4所述的文本处理方法,其中,所述N个级联的文本处理层中的每一个输出的文本处理结果中的句子数目为其输入文本中的句子数目的预定比例。
6.根据权利要求4所述的文本处理方法,还包括:
利用标注有文本处理结果的训练语料,基于损失函数预先训练所述神经网络,
其中,以标注的文本处理结果作为第N层的文本处理结果,以第(n-1)层的文本处理结果与第n层的预处理结果之间的差异,作为所述第(n-1)层的损失函数。
7.根据权利要求4所述的文本处理方法,还包括:
利用标注有文本处理结果的训练语料,基于损失函数预先训练所述神经网络,
其中,以每一个文本处理层的预处理结果与标注的文本处理结果之间的差异,作为每一个文本处理层的所述损失函数。
8.一种文本处理装置,包括:
处理器;以及
存储器,其中存储计算机可读程序指令,
其中,在所述计算机可读程序指令被所述处理器运行时执行基于神经网络的文本处理方法,所述神经网络包括至少一个文本处理层,所述至少一个文本处理层包括输入层、中间层和输出层,所述方法包括:
所述输入层获取输入文本;
所述中间层利用多种不同的处理方法对所述输入文本进行分析,获取对应于所述多种不同的处理方法的多种预处理结果;以及
所述输出层基于所述多种预处理结果,生成并且输出文本处理结果。
9.根据权利要求8所述的文本处理装置,其中,所述中间层利用多种不同的处理方法对所述输入文本进行分析,获取对应于所述多种不同的处理方法的多种预处理结果包括:
所述多种不同的处理方法中的每一种对所述输入文本的所有组成句子进行分析,获取所有组成句子的每一个的句子权重,作为所述预处理结果。
10.根据权利要求9所述的文本处理装置,其中,所述输出层基于所述多种预处理结果,生成并且输出文本处理结果包括:
所述输出层基于所述多种不同的处理方法中的每一种的处理方法权重以及所述多种预处理结果,提取所有组成句子中的预定数目的句子作为所述文本处理结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社NTT都科摩,未经株式会社NTT都科摩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810757854.2/1.html,转载请声明来源钻瓜专利网。