[发明专利]一种基于生成式预训练模型的记忆卡制作方法在审
申请号: | 202210382031.2 | 申请日: | 2022-04-12 |
公开(公告)号: | CN114936288A | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 马嘉浩 | 申请(专利权)人: | 马嘉浩 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/211;G06F40/284 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266034 山东省青岛*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 训练 模型 记忆 制作方法 | ||
1.一种基于生成式预训练模型的记忆卡制作方法,其特征在于,该制作方法具体步骤如下:
步骤(1)确定制卡蓝本资料:获取并确定需要被制作为记忆卡的蓝本资料作为待制作闪卡数据集;
步骤(2)加载预训练模型到内存储和显存:将生成式预训练模型加载到计算机内存储和显存;
步骤(3)使用模型处理资料,生成问答材料:利用步骤(2)所述生成式预训练模型对步骤(1)所述蓝本资料进行处理,得到问答材料;
步骤(4)将问答材料导入anki软件生成卡组:将步骤(3)所述问答材料批量导入进anki软件中,完成记忆卡组批量生成。
2.根据权利要求1所述的一种基于生成式预训练模型的记忆卡制作方法,其特征在于,步骤(1)所述蓝本资料包括科学材料、科普资料、教材和教辅资料。
3.根据权利要求2所述的一种基于生成式预训练模型的记忆卡制作方法,其特征在于,步骤(2)所述生成式预训练模型可以为ERNIE模型或Simnet模型,其基于飞浆框架或者tensorflow实现。
4.根据权利要求1所述的一种基于生成式预训练模型的记忆卡制作方法,其特征在于,步骤(3)在使用模型处理资料,生成问答材料之前需对所述蓝本资料进行预处理,所述预处理包括句子分割、删除短句和分割长句。
5.根据权利要求1所述的一种基于生成式预训练模型的记忆卡制作方法,其特征在于,步骤(3)所述问答材料的具体生成过程如下:
S1:读取蓝本资料进入内存缓存;
S2:对所述蓝本资料进行预处理,并提取高价值蓝本资料;
S3:将所述高价值蓝本资料以列表形式加载进入所述生成式预训练模型,生成问答材料,所述问答材料包括问题句和答案句;
S4:将所述问题句和答案句逐一进行对应。
6.根据权利要求5所述的一种基于生成式预训练模型的记忆卡制作方法,其特征在于,所述高价值蓝本资料根据匹配关键词库进行提取。
7.根据权利要求1所述的一种基于生成式预训练模型的记忆卡制作方法,其特征在于,步骤(4)将问答材料导入anki软件生成卡组前会将高价值蓝本资料进行文本化,其使用UTF-8编码,同时根据分隔符制作卡组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马嘉浩,未经马嘉浩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210382031.2/1.html,转载请声明来源钻瓜专利网。