[发明专利]一种模型训练方法、装置及电子设备在审
申请号: | 202011583008.7 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112560402A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 李嘉茜;邵世臣;李永恒;徐明 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06K9/62;G06N20/20 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 电子设备 | ||
本申请公开了一种模型训练方法、装置及电子设备,涉及计算机技术中的格式转换等技术领域。具体实现方案为:建立初始模型,初始模型用于确定待转换为图片的文档;根据训练文档集的文档属性参数以及训练文档集的文档标签,对初始模型进行训练,得到目标模型;文档属性参数包括以下至少一项:文档格式、文档内容元素数量、文档排版复杂度、文档下载次数。即利用训练文档集的文档属性参数以及训练文档集的文档标签对初始文档模型进行训练,且用于训练的训练文档集的文档属性参数可采用文档格式、文档内容元素数量、文档排版复杂度和文档下载次数中的至少一项参数,可提高训练得到目标模型的性能,从而可提高目标模型筛选待转换图片的文档的准确性。
技术领域
本申请涉及计算机技术中的格式转换等技术领域,尤其涉及一种模型训练方法、装置及电子设备。
背景技术
伴随着移动化办公趋势的发展,在移动终端浏览文档的需求变的愈加普遍。通过移动终端阅读器的服务端对文档进行转码,移动终端加载文档转码后的数据进行展示,用户可通过在移动终端查看文档内容等。
目前,对文档的转码方式主要有两种,即通过阅读器的服务端将文档转码为版式Xreader(一种阅读器,可支持任意大小点阵字体、支持html(HyperText Markup Language,超文本标记语言)读取以及支持编码转换等)数据或流式rtcs(Real-Time ComponentSpecification,实时构件描述)数据,将转码后的数据传给移动终端进行展示。
发明内容
本申请提供一种模型训练方法、装置及电子设备。
第一方面,本申请一个实施例提供一种模型训练方法,所述方法包括:
建立初始模型,所述初始模型用于确定待转换为图片的文档;
根据训练文档集的文档属性参数以及所述训练文档集的文档标签,对所述初始模型进行训练,得到目标模型;
其中,所述文档属性参数包括以下至少一项:
文档格式;
文档内容元素数量;
文档排版复杂度;
文档下载次数。
在本实施例的模型训练方法中,可先建立初始模型,再利用训练文档集的文档属性参数以及所述训练文档集的文档标签,对所述初始模型进行训练,得到目标模型。初始模型用于确定待转换为图片的文档,即筛选待通过转图方式进行处理的文档,利用训练文档集的文档属性参数以及所述训练文档集的文档标签对初始文档模型进行训练,且用于训练的训练文档集的文档属性参数可采用文档格式、文档内容元素数量、文档排版复杂度和文档下载次数中的至少一项参数,可提高训练得到目标模型的性能,从而可提高训练得到的目标模型筛选待转换图片的文档的准确性。
第二方面,本申请一个实施例提供一种模型训练装置,所述装置包括:
模型创建模块,用于建立初始模型,所述初始模型用于确定待转换为图片的文档;
训练模块,用于根据训练文档集的文档属性参数以及所述训练文档集的文档标签,对所述初始模型进行训练,得到目标模型;
其中,所述文档属性参数包括以下至少一项:
文档格式;
文档内容元素数量;
文档排版复杂度;
文档下载次数。
第三方面,本申请一个实施例还提供一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011583008.7/2.html,转载请声明来源钻瓜专利网。