[发明专利]识别模型建立方法及装置、文字识别方法及装置在审
申请号: | 201810439752.6 | 申请日: | 2018-05-09 |
公开(公告)号: | CN108647310A | 公开(公告)日: | 2018-10-12 |
发明(设计)人: | 王世全;江天 | 申请(专利权)人: | 四川高原之宝牦牛网络技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/04 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 陈晓云 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字数据 标记数据 模型建立 图像识别 网络模型 文字识别 语义识别 卷积 模型形成 目标识别 匹配调整 训练模型 语义 非字 | ||
1.一种识别模型建立方法,其特征在于,所述识别模型建立方法包括:
将获得的第一文字数据进行标记,以区别所述第一文字数据中的字丁和非字丁,得到第一标记数据;
将所述第一文字数据输入定义的全卷积网络模型进行训练,并与所述第一标记数据进行对比以调整所述全卷积网络模型的各项参数得到图像识别模型;
对获得的第二文字数据进行标记以标识所述第二文字数据中各个字符的含义以得到第二标记数据;
将所述第二文字数据输入语义训练模型中训练,并与所述第二标记数据进行匹配调整得到语义识别模型,所述图像识别模型与所述语义识别模型形成目标识别模型。
2.如权利要求1所述的识别模型建立方法,其特征在于,所述将所述第一文字数据输入定义的全卷积网络模型进行训练,并与所述第一标记数据进行对比以调整所述全卷积网络模型的各项参数得到图像识别模型的步骤包括:
提取所述第一标记数据中的多种特征信息;
定义与所述多种特征信息包含特征数量对应数量的多层滤波器;
通过所述多层滤波器定义全卷积网络模型;
将所述第一文字数据输入所述全卷积网络模型进行训练得到第一输出结果,将所述第一输出结果与所述第一标记数据的类型做误差对比,调整全卷积网络模型中的各项参数,经过多次训练迭代以调整所述全卷积网络模型中的各项参数得到图像识别模型。
3.如权利要求1或2所述的识别模型建立方法,其特征在于,所述将所述第一文字数据进行标记得到第一标记数据的步骤包括:
对所述第一文字数据进行识别,将识别到的字丁和非字丁进行标记得到第一标记数据。
4.如权利要求1所述的识别模型建立方法,其特征在于,所述将所述第二文字数据输入语义训练模型中训练,并与所述第二标记数据进行匹配调整得到语义识别模型的步骤包括:
使用深度学习算法框架TensorFlow建立语义训练模型;
将所述第二文字数据输入所述语义训练模型进行训练得到第二输出结果,将所述第二输出结果与所述第二标记数据进行误差对比,以调整所述语义训练模型中的各项参数,经过多次训练迭代以调整所述语义训练模型中的各项参数得到语义识别模型。
5.如权利要求1或4所述的识别模型建立方法,其特征在于,所述对获得的第二文字数据进行标记以标识所述第二文字数据中各个字符的含义以得到第二标记数据的步骤包括:
将所述第二文字数据中的字符串进行分词,以将相邻的词语和句子分开;
对分词后的所述第二文字数据进行标记,得到第二标记数据。
6.一种文字识别方法,其特征在于,使用权利要求1-5任意一项所述的识别模型建立方法训练得到的目标识别模型对文字进行识别,所述目标识别模型包括:图像识别模型和语义识别模型,所述文字识别方法包括:
将待识别数据依次输入所述图像识别模型和语义识别模型进行识别,得到识别结果。
7.一种识别模型建立装置,其特征在于,所述识别模型建立装置包括:
第一标记模块,用于将获得的第一文字数据进行标记,以区别所述第一文字数据中的字丁和非字丁,得到第一标记数据;
第一训练模块,用于将所述第一文字数据输入定义的全卷积网络模型进行训练,并与所述第一标记数据进行对比以调整所述全卷积网络模型的各项参数得到图像识别模型;
第二标记模块,用于对获得的第二文字数据进行标记以标识所述第二文字数据中各个字符的含义以得到第二标记数据;
第二训练模块,用于将所述第二文字数据输入语义训练模型中训练,并与所述第二标记数据进行匹配调整得到语义识别模型,所述图像识别模型与所述语义识别模型形成目标识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川高原之宝牦牛网络技术有限公司,未经四川高原之宝牦牛网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810439752.6/1.html,转载请声明来源钻瓜专利网。