[发明专利]语句识别的方法、装置、设备及计算机存储介质在审

申请号：	202110310856.9	申请日：	2021-03-23
公开（公告）号：	CN113064497A	公开（公告）日：	2021-07-02
发明（设计）人：	费腾	申请（专利权）人：	上海臣星软件技术有限公司
主分类号：	G06F3/023	分类号：	G06F3/023;G06F40/279;G06F40/289;G06N3/04
代理公司：	北京东方亿思知识产权代理有限责任公司 11258	代理人：	彭琼
地址：	201802 上海市嘉***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语句识别方法装置设备计算机存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供了一种语句识别的方法、装置、设备及计算机存储介质，通过接收用户在输入法界面内输入第一语句的输入，根据第一语句的输入，通过预设切分模型切分第一语句，得到至少一个文字的切分轨迹，切分模型对语句中各个文字间的任意间距都可以进行切分，保证了语句切分的准确性；通过预设文字识别模型识别至少一个文字的切分轨迹，得到至少一个识别文字；通过预设语言模型组合至少一个识别文字，得到准确度较高的第二语句。通过结合切分模型、文字识别模型以及组合模型对用户手写语句进行识别，提高了对用户手写语句的识别准确率，提高用户输入语句的速度，提升用户使用体验。

技术领域

本申请属于输入法技术领域，尤其涉及一种语句识别的方法、装置、设备及计算机存储介质。

背景技术

随着互联网的普及，越来越广泛的群体接触到移动智能终端。在移动智能终端的使用中，输入法是一个不可或缺的应用程序。输入法的输入方式包括键盘输入、手写输入、语音输入，其中，手写输入方式对于不习惯使用键盘输入方式和语音输入方式的群体来说，极大地提高了他们使用移动智能终端的便捷性。

目前，手写输入方式采用光学字符识别(Optical Character Recognition，OCR)技术对含有手写语句的图像进行分析，获取图像中的文字，OCR技术识别的文字需间距固定、大小一样、字体方正。用户手写的语句情况比较复杂，文字间距不固定、大小不一、字体随意，尤其是，尤其连写或者叠写的情况，OCR技术对用户手写的语句识别不准确，降低用户输入语句的速度，影响用户使用体验。

发明内容

本申请实施例提供一种语句识别的方法、装置、设备及计算机存储介质，能够提高对用户手写语句的识别准确率，提高用户输入语句的速度，提升用户使用体验。

第一方面，本申请实施例提供一种语句识别的方法，方法包括：

接收用户在输入法界面内输入第一语句的输入；

根据第一语句的输入，通过预设切分模型切分第一语句，得到至少一个文字的切分轨迹；

通过预设文字识别模型识别至少一个文字的切分轨迹，得到至少一个识别文字；

通过预设语言模型组合至少一个识别文字，得到第二语句。

在一种可能的实现方式中，根据第一语句的输入，通过预设切分模型切分第一语句，得到至少一个文字的切分轨迹，包括：

根据第一语句的输入轨迹，通过预设切分模型获取第一语句的输入轨迹为起始轨迹的概率值；

当概率值大于预设阈值时，通过预设切分模型切分第一语句，得到至少一个文字的切分轨迹。

在一种可能的实现方式中，通过预设文字识别模型识别至少一个文字的切分轨迹，得到至少一个识别文字，包括：

通过预设文字识别模型识别至少一个文字的切分轨迹，得到至少一个文字的切分轨迹的至少一个第一识别文字，其中，每个第一识别文字对应一个目标概率值，该目标概率值表征文字的切分轨迹与识别字库中预设文字为同一文字的概率值；