[发明专利]一种训练语言模型的方法及系统有效
申请号: | 202010258562.1 | 申请日: | 2020-04-01 |
公开(公告)号: | CN111599349B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 沈华东 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G06F40/30 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 语言 模型 方法 系统 | ||
本发明提供了一种训练语言模型的方法及系统,所述方法包括:对目标语言模型进行若干次测试,获取若干次测试结果;对获取的若干次测试结果进行分析,获取目标语言模型的性能分析结果和所述目标语言模型的参数调节信息;根据性能分析结果和参数调节信息对目标语言模型进行训练。系统包括:获取模块、模型生成模块、模型测试模块、分析模块和调参模块;本发明实现根据若干次测试结果对语言模型的性能分析结果和参数调节信息的自动获取,并根据参数调节信息对语言模型进行训练,进一步实现了对语言模型参数的智能调节;解决了传统语言模型的方法中对语言模型的性能分析和参数调节完全依赖于工作人员的技术能力和经验的缺陷。
技术领域
本发明涉及语言处理技术领域,特别涉及一种训练语言模型的方法及系统。
背景技术
目前,语言模型的训练方法主要包括以下几个过程(如附图3):数据处理、参数调节、模型训练、测试分析、模型发布,即语言模型的训练方法通过获取语言数据,生成语言模型,并对语言模型进行测试,获取测试结果;工作人员根据测试结果,进行人工分析性能,进一步调节语言模型的参数,从而实现对语言模型的训练;该方法存在以下问题:
1、模型的性能分析和参数调节需要花费人员大量的时间精力;
2、调整参数的过程很大依赖调参者的经验,导致训练周期无法具体估计。
发明内容
本发明提供一种训练语言模型的方法及系统,用以解决上述技术问题。
本发明实施例中提供了一种训练语言模型的方法,包括以下步骤:
对目标语言模型进行若干次测试,获取若干次测试结果;
对获取的所述若干次测试结果进行分析,获取所述目标语言模型的性能分析结果和所述目标语言模型的参数调节信息;
根据所述性能分析结果和所述参数调节信息对所述目标语言模型进行训练。
优选的,所述对目标语言模型进行若干次测试前,还包括:获取预设语言数据;根据所述预设语言数据生成目标语言模型;
所述根据所述预设语言数据生成目标语言模型;包括:
获取若干领域的语言数据库,其中,所述若干领域的语言数据库包括所述预设语言数据;
将所述预设语言数据进行划分处理,生成所述预设语言数据的多个元素;
将所述预设语言数据的多个元素与所述若干领域的语言数据库中的语言数据进行比对,获取所述若干领域的语言数据库中与所述预设语言数据的多个元素相似度最高的语言数据对应的语言数据库;
获取所述预设语言数据的多个元素的关联信息;
获取预设语言模型;
根据获取的相似度最高的语言数据对应的语言数据库和所述预设语言数据的多个元素的关联信息基于所述预设语言模型,生成所述目标语言模型。
优选的,所述预设语言数据的多个元素,包括字、词以及句中的一种或多种;
所述预设语言数据的多个元素的关联信息,包括字与字、字与词、字与句、词与词、词与句以及句与句中的一种或多种。
优选的,所述:对目标语言模型进行若干次测试,获取若干次测试结果;包括:
获取所述目标语言模型;
将多个不同的预设测试样本向所述目标语言模型传输,所述目标语言模型根据多个不同的所述预设测试样本生成多个不同的所述预设测试样本对应的多个输出结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010258562.1/2.html,转载请声明来源钻瓜专利网。