[发明专利]自然语言处理的分布式训练方法、装置、设备及存储介质有效
申请号: | 201910539080.0 | 申请日: | 2019-06-20 |
公开(公告)号: | CN110276074B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 王倪东;陈晓宇;林凤绿;李倩 | 申请(专利权)人: | 出门问问信息科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/35;G06F16/33;G06F18/214;G06F18/241;G06N20/00 |
代理公司: | 北京鼎承知识产权代理有限公司 11551 | 代理人: | 李伟波;韩德凯 |
地址: | 100094 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 处理 分布式 训练 方法 装置 设备 存储 介质 | ||
1.一种自然语言处理的分布式训练方法,其特征在于,包括:
接收训练请求并且对所述训练请求进行处理,所述训练请求中包括训练数据、词典数据和/或正则表达式数据;
将包括所述训练数据及相应参数的处理后训练请求发送至消息队列中;
从所述消息队列中获取所述训练请求,并且根据所述训练请求来选择不同的训练模型进行训练;
将训练完成后的训练结果发送至预测流程树构建队列;以及
从所述预测流程树构建队列中获取请求,进行流程树的生成或更新,并且上传生成的流程树或更新的流程树,所述流程树的更新包括修改所述流程树以及添加意图;
在所述预测流程树生成或更新之后,进行配置上传处理;所述配置包括生成或更新之后的所述流程树的内部配置参数,基于所述内部配置参数确定训练类型。
2.如权利要求1所述的方法,其特征在于,在训练服务器接收到所述训练请求后,根据所述训练请求的参数来构建训练参数,并且对所述训练参数进行解析以根据解析后的所述训练参数来选择相应的训练模型。
3.如权利要求2中所述的方法,其特征在于,训练完成后,还包括:将训练后的训练模型及相应资源文件保存至对象存储中。
4.如权利要求3所述的方法,其特征在于,还包括:更新训练后的训练模型的版本号,以及保存与所述训练相关的数据以便进行训练模型版本控制。
5.如权利要求3或4所述的方法,其特征在于,还包括:将模型训练结果上传至配置中心,所述模型训练结果至少还包括训练后的所述训练模型的映射路径。
6.如权利要求5所述的方法,其特征在于,还包括:当所述配置中心进行更新后,至少根据所述映射路径使得预测服务器从所述对象存储获取训练后的所述训练模型,以便更新预测服务器中的所述训练模型。
7.一种自然语言处理的分布式训练装置,其特征在于,包括:
训练请求接收模块,接收训练请求并且对所述训练请求进行处理,所述训练请求中包括训练数据、词典数据和/或正则表达式数据,将包括所述训练数据及相应参数的处理后训练请求发送至消息队列中;
训练服务器模块,从所述消息队列中获取所述训练请求,并且根据所述训练请求来选择不同的训练模型进行训练,训练完成后将训练结果发送至预测流程树构建队列;以及
配置包装模块,从所述预测流程树构建队列中获取请求,进行流程树的生成或更新,并且上传生成的流程树或更新的流程树,所述流程树的更新包括修改所述流程树以及添加意图;
在所述预测流程树生成或更新之后,进行配置上传处理;所述配置包括生成或更新之后的所述流程树的内部配置参数,基于所述内部配置参数确定训练类型。
8.一种电子设备,其特征在于,包括:
存储器,所述存储器存储执行指令;以及
处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行如权利要求1至6中任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现如权利要求1至6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910539080.0/1.html,转载请声明来源钻瓜专利网。