[发明专利]文本识别方法、答案文本的验证方法、装置、设备及介质在审
申请号: | 202211338240.3 | 申请日: | 2022-10-28 |
公开(公告)号: | CN115620314A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 侯琦;李翌昕;林辉;段亦涛 | 申请(专利权)人: | 网易有道信息技术(北京)有限公司 |
主分类号: | G06V30/32 | 分类号: | G06V30/32;G06V10/82;G06V10/80;G06N3/04;G06N3/08 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 张亚辉 |
地址: | 100085 北京市海淀区西北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 答案 验证 装置 设备 介质 | ||
本发明的实施方式提供了一种文本识别方法、答案文本的验证方法、装置、设备及介质。文本识别方法包括:获取目标轨迹点序列;根据目标轨迹点序列,确定待识别文本对应的第一笔画特征以及确定待识别文本对应的第二笔画特征;对第一笔画特征和第二笔画特征进行特征融合,得到融合特征;通过识别融合特征,识别待识别文本。本发明获取含有待识别文本的第一笔画特征和第二笔画特征,对第一笔画特征和第二笔画特征进行融合,以实现在动态笔迹轨迹的基础上,融合了离线图片特征,使得融合特征中既含有动态笔迹轨迹的时序特征,又含有离线图片特征,并在识别文本结果之前,将已经将时序信息与离线图片信息强融合在一起,可以显著提升文本识别的准确率。
技术领域
本发明的实施方式涉及计算机技术领域,更具体地,本发明的实施方式涉及一种文本识别方法、答案文本的验证方法、装置、设备及介质。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
在智能学习类硬件产品或软件产品等应用领域,例如,拥有触摸屏的平板类硬件产品允许用户通过手指或者触控笔完成信息采集;智能书写笔类硬件产品通过摄像设备和点阵纸完成信息采集。这些智能硬件产品采集的信息实质上是一串包含(坐标点,压力值,时间戳)的轨迹点集合,而将这些轨迹点转换为可编辑的文本,所需要的核心技术即为手写文本识别。例如,扫描仪或者数码相机等电子设备采用光学的方式,将人书写的纸质文档中的手写文本转换为静态的图像文件完成信息采集;而将这些图像文件中存储的文本信息转换为可编辑的文本,所需要的核心技术即为手写文本识别;这里的文本不只限于文字,还包括公式。
发明内容
但是,出于现有的手写文本识别准确率低的原因,现有技术中,从输入的角度来看,手写文本识别根据采集设备的不同,可以分为联机手写识别和脱机手写识别。脱机手写识别基于拍照或者扫描等方式获取的静态图像,拥有全局的视觉信息,但缺少时序信息;联机手写识别基于智能设备获取的动态轨迹点序列,包含丰富的时序信息,但对时序正确性有要求,容易受到书写顺序等问题影响识别。
为了解决该问题,相关技术中提出一种基于脱机识别方法和联机识别方法集成的手写文字的识别方法,该方案的脱机手写识别方法是通过提取汉字轮廓的方向角特征以及弹性模版匹配来确定脱机候选识别文字;联机手写识别方法则是通过提取汉字笔画的方向特征以及弹性模版匹配来确定联机候选识别文字;然后根据脱机候选识别文字的匹配打分和联机候选识别文字的匹配打分,确定最终的识别结果,这也是两种信息集成的体现。
在另一个方案中,提出了一种基于笔顺以及OCR的手写文字识别方法,该方案首先通过OCR采集装置获取脱机文本图像,输入到预设的OCR识别算法得到初步文字识别结果;然后将OCR采集装置获取的联机轨迹信息和预设字符数据库进行比对匹配,修正初步文字识别结果,进而确定最终的识别结果,这也是两种信息集成的体现。
因此在现有技术中,联机轨迹信息和脱机图片信息的集成过程是弱耦合的,这种集成手段使得两种信息的传递是相对独立的,各自单独完成候选文字的识别过程,只是在确定最终识别结果时发生了交互,这是非常令人烦恼的过程。
为此,非常需要一种改进的手写文本识别,以提高手写文本识别的准确率。
在本上下文中,本发明的实施方式期望提供一种文本识别方法、答案文本的验证方法、装置、设备及介质。
在本发明实施方式的第一方面中,提供了一种文本识别方法,该方法包括:
获取目标轨迹点序列,其中,所述目标轨迹点序列包括从待识别文本的动态笔迹中采集到的多个且连续的轨迹点;
根据所述目标轨迹点序列,确定所述待识别文本对应的第一笔画特征以及确定所述待识别文本对应的第二笔画特征,其中,所述第一笔画特征至少含有书写所述待识别文本的时序特征,所述第二笔画特征为从含有所述待识别文本的文本图像中提取的图片特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易有道信息技术(北京)有限公司,未经网易有道信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211338240.3/2.html,转载请声明来源钻瓜专利网。