[发明专利]一种基于深度学习的盲文转中文方法在审
申请号: | 202010466752.2 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111814437A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 于红雷;邹可;孙俊伟 | 申请(专利权)人: | 杭州视氪科技有限公司 |
主分类号: | G06F40/16 | 分类号: | G06F40/16;G06F40/226;G06F40/126;G06N3/04;G06N3/08 |
代理公司: | 杭州伍博专利代理事务所(普通合伙) 33309 | 代理人: | 熊小芬 |
地址: | 311121 浙江省杭州市余杭区余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 盲文 中文 方法 | ||
本发明公开了一种基于深度学习的盲文转中文方法。它具体包括如下步骤:(1)对盲文文本预处理:盲文文本预处理对盲文做编码归一化处理;(2)深度学习算法模型构建:深度学习算法模型学习编码后的文本规律;(3)训练深度学习模型:通过深度学习模型翻译出对应的中文内容;(4)文本纠错:在文本纠错单元对盲文中的错别字进一步纠错。本发明的有益效果是:达到高精准度文本翻译结果。
技术领域
本发明涉及深度学习相关技术领域,尤其是指一种基于深度学习的盲文转中文方法。
背景技术
盲文或称点字、凸字,是专为盲人设计、靠触觉感知的文字。透过点字板、点字机、点字打印机等在纸张上制作出不同组合的凸点而组成,一般每一个方块的点字是由六点组成,左侧从上到下为123,右侧为456,叫一方。它是由法国盲人路易·布莱尔于1824年创造的,故国际上通称为“布莱尔(Braille)”。
现有的盲文转中文的操作方式中,只是简单的对盲文进行一对一的中文字符转化,导致转化过来的中文往往存在错别字、语句不通顺或者翻译不正确,这样的转化方式导致盲文的文本转化率大大降低,准确率也不高。
发明内容
本发明是为了克服现有技术中存在上述的不足,提供了一种高精准度的基于深度学习的盲文转中文方法。
为了实现上述目的,本发明采用以下技术方案:
一种基于深度学习的盲文转中文方法,具体包括如下步骤:
(1)对盲文文本预处理:盲文文本预处理对盲文做编码归一化处理;
(2)深度学习算法模型构建:深度学习算法模型学习编码后的文本规律;
(3)训练深度学习模型:通过深度学习模型翻译出对应的中文内容;
(4)文本纠错:在文本纠错单元对盲文中的错别字进一步纠错。
本发明通过盲文文本预处理对算法输入部分做编码归一化处理,然后经过深度学习模型学习编码后的文本规律,经过训练深度学习模型翻译出对应的中文内容,最后在经过文本纠错单元对错别字进一步纠错,达到高精准度文本翻译结果。
作为优选,在步骤(1)中,盲文文本预处理的具体方法如下:
(11)对于盲文句子,根据盲文的特点,每一个中文字符对应的盲文都采用三方对齐表示,不足三方的用数字0填充表示;
(12)对填充对齐后的盲文句子进行编码,转换成十进制编码字符串,编码后的字符串映射到0到63的编码空间,每个编码后的十进制数对应一个0到63的数字;
(13)将每个编码后的十进制数替换成0到63对应的十进制数字,替换后的数字序列就是预处理的最终结果。
作为优选,在步骤(12)中,盲文句子进行编码的具体方法如下:
(121)对每一个盲文点方所代表的数字集合,对每一个数字进行计算,其中N表示盲文点方中每一个点代表的数字;
(122)每一个盲文点方对所有的数字进行计算,然后求和,计算所得的数字就是编码后的值。
作为优选,在步骤(2)中,深度学习模型构建的具体方法如下:
(21)对编码后的盲文句子进行词嵌入编码,输出词嵌入编码后的词向量;
(22)用cnn网络提取句子的语法信息和单词前后关联信息;
(23)用双向lstm网络提取整个句子的句法结构信息;
(24)步骤(23)作为网络的输出,通过交叉熵作为损失函数loss。
作为优选,在步骤(22)中,具体操作方法如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州视氪科技有限公司,未经杭州视氪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010466752.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:导热油炉的节能减排控制方法及控制系统
- 下一篇:一种螺旋提升机