[发明专利]语义识别方法、装置、设备及计算机可读存储介质在审

申请号：	201910137315.3	申请日：	2019-02-25
公开（公告）号：	CN109993057A	公开（公告）日：	2019-07-09
发明（设计）人：	周罡	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06F17/27;G06N3/04
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	胡海国
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本行图像备选文字手写计算机可读存储介质循环神经网络概率分布语义识别卷积集合语义分析结果语义分析语义解析词向量预设输出分析
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于语义解析技术领域，提供一种语义识别方法、装置、设备及计算机可读存储介质，该方法包括：获取待识别手写文本行图像；将所述待识别手写文本行图像输入至训练好的卷积循环神经网络模型中进行分析，得到训练好的卷积循环神经网络模型输出的，所述待识别手写文本行图像中每个待识别文字对应的备选文字概率分布；根据每个待识别文字对应的所述备选文字概率分布，确定每个待识别文字对应的目标备选文字集合；通过预设的词向量word2vec模型，对每个待识别文字对应的所述目标备选文字集合进行语义分析，以确定语义分析结果。本发明能够提高对手写文本行图像的识别精确度。

技术领域

本发明涉及语义解析技术领域，尤其涉及一种语义识别方法、装置、设备及计算机可读存储介质。

背景技术

传统的语义识别模型仅对标准的、书写简单且规范的句子有较好准确度的识别，但是对于手写句子，由于每个人的书写习惯不同，写出的每个字并不是由标准的横竖撇捺组成，加大了识别难度，导致识别的精确度不高。

发明内容

本发明的主要目的在于提供一种语义识别方法、装置、设备及计算机可读存储介质，旨在解决传统的语义识别模型对手写句子的识别精确度不高的技术问题。

为实现上述目的，本发明提供一种语义识别方法，所述语义识别方法包括以下步骤：

获取待识别手写文本行图像；

将所述待识别手写文本行图像输入至训练好的卷积循环神经网络模型中进行分析，得到训练好的卷积循环神经网络模型输出的，所述待识别手写文本行图像中每个待识别文字对应的备选文字概率分布；

根据每个待识别文字对应的所述备选文字概率分布，确定每个待识别文字对应的目标备选文字集合；

通过预设的词向量word2vec模型，对每个待识别文字对应的所述目标备选文字集合进行语义分析，以确定语义分析结果。

可选地，所述根据每个待识别文字对应的所述备选文字概率分布，确定每个待识别文字对应的目标备选文字集合的步骤包括：