[发明专利]一种针对国产操作系统的图片内容提取方法在审
申请号: | 201811598225.6 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109858350A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 傅涛;王力;郑轶;梁旭 | 申请(专利权)人: | 江苏博智软件科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06F9/4401;G06F9/455 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210012 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种针对国产操作系统的图片内容提取方法。所述方法包括基于国产操作系统的live CD子系统,虚拟机管理子系统,MODI内容提取子系统,以及透明代理子系统。首先使用liveCD子系统引导客户机启动,然后虚拟机管理子系统会自动启动MODI内容提取子系统,透明代理子系统客户端负责将图片文件传入位于MODI内容提取子系统中的代理服务端,并传给提取服务模块,后者提取文本数据再由代理服务端传回代理客户端,完成内容提取。本方法具有较高的中文内容识别率,对客户机操作系统环境无侵入性,不残留使用痕迹,对客户机硬件具有广泛兼容性。 | ||
搜索关键词: | 内容提取 操作系统 虚拟机管理 代理服务 透明代理 图片内容 客户机操作系统 提取文本数据 代理客户端 客户机硬件 内容识别 提取服务 图片文件 自动启动 兼容性 客户端 客户机 侵入性 残留 中文 | ||
【主权项】:
1.一种针对国产操作系统的图片内容提取方法,其工作步骤如下:步骤1:使用国产liveCD操作系统引导客户机启动,整个操作系统(包括文件系统)均处于内存当中,并自动挂载客户机磁盘;步骤2:虚拟机自启动脚本引导使用预置Windows镜像启动内容提取子系统虚拟机,该系统启动后会启动Microsoft Office Document Imaging 图片内容提取服务以及透明代理服务端;步骤3:用户传入待提取的图片文件路径给透明代理客户端,客户端读取文件内容并通过TCP协议发送给Windows虚拟机内的透明代理服务端步骤4:代理服务端将图片文件传给MODI内容提取服务进行文字识别,提取后得到文本数据再由代理服务端发送给代理客户端,完成整个图片内容提取流程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏博智软件科技股份有限公司,未经江苏博智软件科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811598225.6/,转载请声明来源钻瓜专利网。