[发明专利]一种生成手写公式的方法及装置在审
申请号: | 202111152754.5 | 申请日: | 2021-09-29 |
公开(公告)号: | CN113885713A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 刘水;辛晓哲 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06K9/00;G06K9/62;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 储倩 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生成 手写 公式 方法 装置 | ||
本申请公开了一种生成手写公式的方法,具体地:可以获取待处理公式,并确定第一手写风格。第一手写风格为根据所述待处理公式生成的手写公式的风格。在本申请实施例中,对于待处理公式而言,可以获取该待处理公式中各个字符的字符轨迹,并根据该待处理公式中各个字符的字符轨迹生成目标手写公式。并且,所述各个字符的字符轨迹对应第一手写风格。由此可见,利用本方案,可以为待处理公式生成第一手写风格的目标手写公式。进一步地,利用本方案,可以生成大量的手写公式,从而利用该手写公式训练用于识别手写公式的机器学习模型。
技术领域
本申请涉及数据处理领域,特别是涉及一种生成手写公式的方法及装置。
背景技术
在一些场景中,需要识别手写公式。例如,用户利用手写输入法输入公式时,需要对用户手写的公式进行识别。又如,需要识别图片中包括的手写公式。目前,可以预先训练机器学习模型,利用该机器学习模型来识别手写公式。但是,训练所述机器学习模型,需要大量的手写公式作为训练样本,而目前可用于训练该机器学习模型的手写公式并不多。
因此,如何获得大量的手写公式,成为目前急需解决的问题
发明内容
本申请所要解决的技术问题是如何生成手写公式,提供一种生成手写公式的方法及装置。
第一方面,本申请实施例提供了一种生成手写公式的方法,所述方法包括:
获取待处理公式,并确定第一手写风格;
获取所述待处理公式中各个字符分别对应所述第一手写风格的字符轨迹;
根据所述字符轨迹,生成所述第一手写风格的目标手写公式。
可选的,获取所述待处理公式中各个字符分别对应所述第一手写风格的字符轨迹,包括:
根据所述第一手写风格对应的所述待处理公式中各个字符分别对应的索引值,从预先存储的字符数据库中,确定所述待处理公式中各个字符分别对应所述第一手写风格的字符轨迹;其中:
所述待处理公式包括第一字符,所述第一手写风格对应的第一字符的索引,用于从所述字符数据库中存储的所述第一字符的多个字符轨迹中,确定所述第一字符的、与所述第一手写风格对应的字符轨迹,所述多个字符轨迹对应至少一种手写风格。
可选的,所述方法还包括:
获取所述第一手写风格对应的各个字符对应的字符轨迹;
根据所述第一手写风格对应的各个字符对应的字符轨迹,从所述字符数据库中,确定出与所述第一手写风格对应的各个字符对应的字符轨迹匹配的字符轨迹,并生成所述第一手写风格对应的各个字符对应的字符轨迹的索引。
可选的,所述根据所述第一手写风格对应的各个字符对应的字符轨迹,从所述字符数据库中,确定出与所述第一手写风格对应的各个字符对应的字符轨迹匹配的字符轨迹,包括:
将所述第一手写风格对应的各个字符对应的字符轨迹的轨迹图片,与所述字符数据库中各个字符对应的轨迹图片进行匹配,确定与所述第一手写风格对应的各个字符对应的字符轨迹匹配的字符轨迹;
其中:
所述第一手写风格对应的各个字符包括第二字符,当所述第二字符的轨迹图片与所述字符数据库中所述第二字符的第一轨迹图片匹配时,将所述第一轨迹图片对应的字符轨迹,确定为与所述第二字符匹配的字符轨迹。
可选的,所述方法还包括:
获取各个字符的字符轨迹,并根据所述各个字符的字符轨迹,生成各个字符对应的轨迹图片;
对所述各个字符对应的轨迹图片进行聚类,将所述各个字符中每个字符的字符轨迹划分成至少一类,每一类对应一种手写风格;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111152754.5/2.html,转载请声明来源钻瓜专利网。