[发明专利]一种基于Ant Design Vue和Flask的盲文识别系统在审
申请号: | 202210270078.X | 申请日: | 2022-03-18 |
公开(公告)号: | CN114677688A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 卜佳俊;林帅浩;于智;谷雨;邢航笛;李亮城;邵子睿;陈锶皓;戚忠达 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06F40/58;G06F40/126 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王幸祥 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ant design vue flask 盲文 识别 系统 | ||
1.一种基于Ant Design Vue和Flask的盲文识别系统,其特征在于,包括:
模块1,系统的账户管理;该模块1包括:
子模块11,注册,根据输入的手机,邮箱,账户密码等信息生成一个账号,所有用户数据在数据库中以自增Id为主键,并且密码采用md5的方式加密,保证用户的隐私不被窃取;之后手机号就可以作为子模块12登录的用户名;
子模块12,登录,根据输入的用户名和密码来判定用户是否可以登录到系统,用户名和密码必须是经过子模块11注册过的,密码采用md5加密的方式传输到服务器与数据库中保存的md5形式的密码比较,正确的用户名和密码可以登录到系统并使用系统的功能,登录成功后,系统会将服务器发送的Token保存下来,表示当前是登录状态;
模块2,任务管理,子模块12登录完成后,系统会显示当前登录用户的所有任务,每个任务在数据库中都有一条记录,保存了任务的创建时间,修改时间,创建该任务的用户,任务备注以及任务中的图片等信息;该模块2包括:
子模块21,盲文识别任务存储;系统将所有盲文识别任务存储在Mysql数据库中,每个任务在数据库中都有一条记录,保存了任务的创建时间,修改时间,创建该任务的用户,任务备注以及任务中的各个图片等信息;
子模块22,检索盲文识别任务;系统检测到处于登录状态后,根据输入的任务备注信息以及选定的时间范围从子模块21来检索当前登录用户的任务;
子模块23,新建盲文识别任务;在检索任务后,如果没有自己想要的图片,可以新建盲文识别任务,根据用户输入的任务名称,备注等信息以及上传的盲文图片新建一个盲文识别任务,在子模块21中新增一条任务记录,任务状态标记为翻译中;
子模块24,查看识别任务;根据选定的任务,系统从子模块21查询出所有该任务的信息以及属于该任务的图片,展示该任务的所有图片缩略图,每个缩略图都可以点击,系统根据点击的缩略图显示对应的翻译结果;
模块3,盲文图片识别,从子模块23获取到新建任务中输入的盲文图片或者子模块24中获取到追加任务图片后,先是识别出所有的盲文方类别,然后将盲文方类别转换为拼音,再把拼音转换为汉字,识别完成后,该图片以及图片的备注,图片中识别出来的汉字以及坐标都会保存到子模块21中;该模块包括:
子模块31,识别盲文图片中盲文方的类别和坐标,系统从子模块23或者子模块24上传的盲文图片中识别出盲文方的点位类别,该过程采用计算机视觉领域的RetinaNet模型,RetinaNet模型的训练数据来自于DSBI数据集,模型首先识别出盲文方所在的每一行,然后按行识别出盲文方的点的为和类别;盲文图片经过RetinaNet模型识别后会输出一个结果字典,字典内包括盲文方类别序列,盲文方坐标序列,识别准确率等,同时系统会根据输出的坐标序列在盲文图片中将每个盲文方用方框圈出;
子模块32,盲文方类别转拼音,根据子模块31中输出的盲文方类别和坐标序列,参照最新版的盲文方类别和拼音之间的映射关系和转换规则,将盲文方类别序列转换为拼音和标点符号的序列以及拼音坐标的序列,同时还要注意一些盲文中拼音的简化规则,将这些简化的拼音还原为完整的拼音,以便提高拼音转汉字的正确率;
子模块33,拼音转汉字,将子模块32输出的拼音序列转换为中文汉字序列,该过程采用自然语言处理模型Transformer中的Encoder模型,Encoder模型的训练数据包括高中语文课文,初中语文课文,小学语文课文,中小学课外读物,高考试卷和古诗词等,共计600万中文字符;模型的输入是一张盲文图片中识别出的所有拼音,模型的输出是拼音序列对应的汉字序列;
子模块34,汉字数据存储以及可视化,将子模块32输出的拼音坐标序列和子模块33输出的汉字序列对应起来,在盲文图片上显示出来,同时将汉字序列和坐标序列存储在子模块21中的对应任务内。
2.如权利要求1所述的基于Ant Design Vue和Flask的盲文识别系统,其特征在于,子模块24还包括修改翻译文本,系统根据修改后的文本与原本的文本对比根据最长公共子序列算法计算出最优的匹配,然后将修改后的文本替换并更新到盲文图片中以及子模块21中。
3.如权利要求1所述的基于Ant Design Vue和Flask的盲文识别系统,其特征在于,子模块24还包括追加任务图片,系统获取到新输入的图片并识别后,将这些图片追加在本任务的记录中。
4.如权利要求1所述的基于Ant Design Vue和Flask的盲文识别系统,其特征在于,子模块24还包括删除图片和任务,系统会根据用户选择删除本任务,或者本任务中的某个图片,删除后的图片将会从子模块21中删除且不会再本任务中出现,删除后的任务也不会出现在任务列表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210270078.X/1.html,转载请声明来源钻瓜专利网。