[发明专利]语句识别的方法、装置、设备及计算机存储介质在审
申请号: | 202110310856.9 | 申请日: | 2021-03-23 |
公开(公告)号: | CN113064497A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 费腾 | 申请(专利权)人: | 上海臣星软件技术有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F40/279;G06F40/289;G06N3/04 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 201802 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 识别 方法 装置 设备 计算机 存储 介质 | ||
本申请实施例提供了一种语句识别的方法、装置、设备及计算机存储介质,通过接收用户在输入法界面内输入第一语句的输入,根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹,切分模型对语句中各个文字间的任意间距都可以进行切分,保证了语句切分的准确性;通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字;通过预设语言模型组合至少一个识别文字,得到准确度较高的第二语句。通过结合切分模型、文字识别模型以及组合模型对用户手写语句进行识别,提高了对用户手写语句的识别准确率,提高用户输入语句的速度,提升用户使用体验。
技术领域
本申请属于输入法技术领域,尤其涉及一种语句识别的方法、装置、设备及计算机存储介质。
背景技术
随着互联网的普及,越来越广泛的群体接触到移动智能终端。在移动智能终端的使用中,输入法是一个不可或缺的应用程序。输入法的输入方式包括键盘输入、手写输入、语音输入,其中,手写输入方式对于不习惯使用键盘输入方式和语音输入方式的群体来说,极大地提高了他们使用移动智能终端的便捷性。
目前,手写输入方式采用光学字符识别(Optical Character Recognition,OCR)技术对含有手写语句的图像进行分析,获取图像中的文字,OCR技术识别的文字需间距固定、大小一样、字体方正。用户手写的语句情况比较复杂,文字间距不固定、大小不一、字体随意,尤其是,尤其连写或者叠写的情况,OCR技术对用户手写的语句识别不准确,降低用户输入语句的速度,影响用户使用体验。
发明内容
本申请实施例提供一种语句识别的方法、装置、设备及计算机存储介质,能够提高对用户手写语句的识别准确率,提高用户输入语句的速度,提升用户使用体验。
第一方面,本申请实施例提供一种语句识别的方法,方法包括:
接收用户在输入法界面内输入第一语句的输入;
根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹;
通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字;
通过预设语言模型组合至少一个识别文字,得到第二语句。
在一种可能的实现方式中,根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹,包括:
根据第一语句的输入轨迹,通过预设切分模型获取第一语句的输入轨迹为起始轨迹的概率值;
当概率值大于预设阈值时,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹。
在一种可能的实现方式中,通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个识别文字,包括:
通过预设文字识别模型识别至少一个文字的切分轨迹,得到至少一个文字的切分轨迹的至少一个第一识别文字,其中,每个第一识别文字对应一个目标概率值,该目标概率值表征文字的切分轨迹与识别字库中预设文字为同一文字的概率值;
确定至少一个文字的切分轨迹的至少一个第一识别文字的概率值中最大概率值对应的第一识别文字为至少一个识别文字。
在一种可能的实现方式中,通过预设语言模型组合至少一个识别文字,得到第二语句,包括:
通过预设语言模型组合至少一个识别文字,得到至少一个组合语句;
计算至少一个组合语句中每个组合语句的分数值;
确定至少一个组合语句中分数值最大的组合词句为第二语句。
在一种可能的实现方式中,在根据第一语句的输入,通过预设切分模型切分第一语句,得到至少一个文字的切分轨迹之前,方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海臣星软件技术有限公司,未经上海臣星软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110310856.9/2.html,转载请声明来源钻瓜专利网。