[发明专利]检测模型训练、判题方法、装置、电子设备及存储介质有效
申请号: | 202011585373.1 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112308053B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 李兵;秦勇 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 林军;王珺 |
地址: | 100144 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 模型 训练 方法 装置 电子设备 存储 介质 | ||
本申请提出一种检测模型训练、判题方法、装置、电子设备及存储介质。其中,所述检测模型训练方法包括:将待批改样本图像输入检测模型,得到待批改样本图像的版面分析检测结果和目标文本检测结果;基于待批改样本图像的版面分析检测结果,确定第一损失函数;基于待批改样本图像的目标文本检测结果,确定第二损失函数;基于第一损失函数、第二损失函数以及预设调整系数,确定检测模型的总损失函数,其中,预设调整系数是根据检测模型中用于对题目进行版面分析的第一文本框的类别数量和用于对题目中目标文本进行检测的第二文本框的类别数量得到的;基于总损失函数,对检测模型进行训练。检测模型的准确性和效率得到了提升。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种检测模型训练、判题方法、装置、电子设备及存储介质。
背景技术
拍照判题是人工智能技术在教育领域的一项重要应用,主要流程包括:通过手机或平板电脑等终端设备进行拍照,然后将拍照得到的图像上传至拍照判题的应用程序进行判题。判题时,基于版面分析模型、文本行检测模型和识别模型实现判题,具体的,版面分析模型对题型进行判断得到题型和文本区域坐标(用文本框装起来),文本行检测模型只检测横向文本行(用文本框框起来),然后,根据版面分析模型和文本行检测模型的检测结果进行版面分析,对两个检测结果的框进行合并,同时根据每种题型的特点,分析得到每个题是由哪些框组成的,然后根据框的坐标在原图上进行裁剪,将裁剪得到的图像输入识别模型,得到每个题目的内容,然后根据题目内容进行判题,最后将判断结果进行输出。
然而,上述拍照判题方案,如果在理想情况下,版面分析模型、文本行检测模型和识别模型的结果都非常准确,那么最后通过判题策略得到的判题结果也会相当准确。但是,实际情况是,上述的拍照判题流程的前三个环节,每个环节的结果都不是非常准确,这导致最终的判题结果会出现错判对或者对判错的问题,也就是判题准确率比较低。
发明内容
本申请实施例提供检测模型训练、判题方法、装置、电子设备及存储介质,以解决相关技术存在的问题。
根据本申请的第一方面,提供了一种检测模型训练方法,包括:
将待批改样本图像输入检测模型,得到待批改样本图像的版面分析检测结果和目标文本检测结果;
基于待批改样本图像的版面分析检测结果,确定第一损失函数;
基于待批改样本图像的目标文本检测结果,确定第二损失函数;
基于第一损失函数、第二损失函数以及预设调整系数,确定检测模型的总损失函数,其中,预设调整系数是根据检测模型中用于对题目进行版面分析的第一文本框的类别数量和用于对题目中目标文本进行检测的第二文本框的类别数量得到的;以及
基于总损失函数,对检测模型进行训练。
在一种实施方式中,还包括:
基于第二文本框的类别数量与第一文本框的类别数量的比较结果,得到预设调整系数。
在一种实施方式中,基于第二文本框的类别数量与第一文本框的类别数量的比较结果,得到预设调整系数,包括:
将第二文本框的类别数量与第一文本框的类别数量的比值,作为预设调整系数。
在一种实施方式中,还包括:
获取预设的第一文本框的类别数量、第二文本框的类别数量与预设调整系数的对应关系;
基于对应关系,确定与第一文本框的类别数量、第二文本框的类别数量对应的预设调整系数。
在一种实施方式中,基于第一损失函数、第二损失函数以及预设调整系数,确定检测模型的总损失函数,包括:
基于预设调整系数和第一损失函数,得到第三损失函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011585373.1/2.html,转载请声明来源钻瓜专利网。