[发明专利]一种手写识别方法、装置、电子设备及介质在审

申请号：	202011640989.4	申请日：	2020-12-31
公开（公告）号：	CN112766080A	公开（公告）日：	2021-05-07
发明（设计）人：	辛晓哲;秦波;赵志勇;王英俊;王杰;苏雪峰;陈伟	申请（专利权）人：	北京搜狗科技发展有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	北京华沛德权律师事务所 11302	代理人：	房德权
地址：	100084 北京市海淀区中关***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种手写识别方法装置电子设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种手写识别方法，实时获取手写原始轨迹数据；对所述手写原始轨迹数据进行压缩，得到压缩手写轨迹数据；将所述压缩手写轨迹数据输入到压缩后的手写识别模型中进行识别，得到所述手写原始轨迹数据对应的文字识别结果，其中，所述手写识别模型是利用训练数据集中每个训练数据的手写轨迹数据训练得到的，压缩后的所述手写识别模型是对所述手写识别模型进行模型压缩得到的。本发明实施例提供的手写识别方法，能够解决现有技术中非正确切分导致手写识别准确率低的问题，能够有效提高致手写识别准确率。

技术领域

本发明实施例涉及互联网技术领域，尤其涉及一种手写识别方法、装置、电子设备及介质。

背景技术

随着互联网技术的飞速发展，为了方便用户输入，通常会提供多种输入方式例如包括语音输入、手写输入和拼音输入等方式，当用户使用手写输入时，会通过手写识别模型对手写输入的数据进行识别，提高识别效率，使得用户的体验更好。

但是，现有技术中在手写数据进行识别的手写识别框架通常是基于切分、组合再识别的三阶段架构，在使用手写识别框架进行识别时，尤其是在针对连笔输入例如连笔草书和连笔行书等连笔手写进行识别时，由于连笔手写中间没有断笔，切分模块针对连笔手写进行切分时存在非正确切分的概率非常高，进而会导致识别的准确率较低。

发明内容

本发明实施例提供了一种手写识别方法、装置、电子设备及介质，能够解决现有技术中非正确切分导致手写识别准确率低的问题，能够有效提高致手写识别准确率。

本发明实施例第一方面提供了一种手写识别方法，包括：

实时获取手写原始轨迹数据；

对所述手写原始轨迹数据进行压缩，得到压缩手写轨迹数据；

将所述压缩手写轨迹数据输入到压缩后的手写识别模型中进行识别，得到所述手写原始轨迹数据对应的文字识别结果，其中，所述手写识别模型是利用训练数据集中每个训练数据的手写轨迹数据训练得到的，压缩后的所述手写识别模型是对所述手写识别模型进行模型压缩得到的。

可选的，所述实时获取手写原始轨迹数据，包括：