[发明专利]一种训练语言模型的方法及系统有效

申请号：	202010258562.1	申请日：	2020-04-01
公开（公告）号：	CN111599349B	公开（公告）日：	2023-04-18
发明（设计）人：	沈华东	申请（专利权）人：	云知声智能科技股份有限公司;厦门云知芯智能科技有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G06F40/30
代理公司：	北京冠和权律师事务所 11399	代理人：	张楠楠
地址：	100000 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种训练语言模型方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种训练语言模型的方法及系统，所述方法包括：对目标语言模型进行若干次测试，获取若干次测试结果；对获取的若干次测试结果进行分析，获取目标语言模型的性能分析结果和所述目标语言模型的参数调节信息；根据性能分析结果和参数调节信息对目标语言模型进行训练。系统包括：获取模块、模型生成模块、模型测试模块、分析模块和调参模块；本发明实现根据若干次测试结果对语言模型的性能分析结果和参数调节信息的自动获取，并根据参数调节信息对语言模型进行训练，进一步实现了对语言模型参数的智能调节；解决了传统语言模型的方法中对语言模型的性能分析和参数调节完全依赖于工作人员的技术能力和经验的缺陷。

技术领域

本发明涉及语言处理技术领域，特别涉及一种训练语言模型的方法及系统。

背景技术

目前，语言模型的训练方法主要包括以下几个过程(如附图3)：数据处理、参数调节、模型训练、测试分析、模型发布，即语言模型的训练方法通过获取语言数据，生成语言模型，并对语言模型进行测试，获取测试结果；工作人员根据测试结果，进行人工分析性能，进一步调节语言模型的参数，从而实现对语言模型的训练；该方法存在以下问题：

1、模型的性能分析和参数调节需要花费人员大量的时间精力；

2、调整参数的过程很大依赖调参者的经验，导致训练周期无法具体估计。

发明内容

本发明提供一种训练语言模型的方法及系统，用以解决上述技术问题。

本发明实施例中提供了一种训练语言模型的方法，包括以下步骤：

对目标语言模型进行若干次测试，获取若干次测试结果；

对获取的所述若干次测试结果进行分析，获取所述目标语言模型的性能分析结果和所述目标语言模型的参数调节信息；

根据所述性能分析结果和所述参数调节信息对所述目标语言模型进行训练。

优选的，所述对目标语言模型进行若干次测试前，还包括：获取预设语言数据；根据所述预设语言数据生成目标语言模型；

所述根据所述预设语言数据生成目标语言模型；包括：

获取若干领域的语言数据库，其中，所述若干领域的语言数据库包括所述预设语言数据；

将所述预设语言数据进行划分处理，生成所述预设语言数据的多个元素；