[发明专利]一种基于GDI拦截的表格识别方法有效
申请号: | 201710149981.X | 申请日: | 2017-03-14 |
公开(公告)号: | CN108572943B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 梁威;廖上平 | 申请(专利权)人: | 长沙博为软件技术股份有限公司 |
主分类号: | G06F40/177 | 分类号: | G06F40/177;G06V30/414 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410013 湖南省长沙市长沙高*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gdi 拦截 表格 识别 方法 | ||
本发明提供一种基于GDI拦截的表格识别方法,该方法包括步骤为对表格窗体进行定位,抓取窗体内表格的文本和线条,对多余线条进行排除,对表格边框进行识别和或者自定义边框,还原系统表格文本和表格格式,获取单元格文本内容,本发明方法通过所有GDI文本和线条组成的表格获取信息系统的表格内容和格式,通过配置支持无合并单元格和存在合并单元格表格,达到可根据任意单元格获取其文本。
技术领域
本发明涉及图像处理技术领域,特别涉及一种基于GDI拦截的表格识别方法。
背景技术
随着我国医院数字化、信息化建设的发展,医院信息管理系统(HIS)、检验信息系统(LIS)、影像系统(PACS)、体检管理系统(PEIS)、电子病历(EMR)等各种医疗子系统已被医院所采用。以往医院需要对各系统的数据进行关联并在院内共享,以方便在各个科室提取并分析数据。在现有的互联网时代,如能够将数据正确地提取、重构并利用互联网传输,将极大地提高医疗资源的灵活配置,使远程会诊、远程医疗成为一种常见的、低成本的、便捷的就诊手段。
在现有技术中,通过窗口采集可以将在Windows系统中运行的各应用的窗口图像采集下来,并保存为位图。如果只采集某一时间点的窗口图像,则可以获得静止的、该时间点的窗口图像的截图;如果采集连续时间段内的窗口图像,则可以获得动态的、该连续时间段内的窗口图像的视频。
在进行窗口图像的采集时,可以基于Windows图形设备接口(Graphics DeviceInterface,GDI)应用程序编程接口(Application Programming Interface,API)进行窗口图像采集,或者也可以采用特定类型的API进行窗口图像的采集。
具体的,在基于Windows GDI API进行窗口图像的采集时,需要先获得指定窗口的上下文句柄(Handle of Device Context,HDC),再利用GDI API的BitBlt等函数,将窗口图像拷贝到指定位置。该方法只能采集到基于GDI渲染的窗口图像,而很多应用的窗口图像并不是基于GDI渲染的,比如很多游戏应用、视频应用等并不是基于GDI渲染的。因此采用该方法采集窗口图像时,只能采集到基于GDI渲染的应用的窗口图像,无法采集到非基于GDI渲染的应用的窗口图像。
对于医疗信息系统中,在远程会诊、远程医疗系统开发的过程中与各个医院的子系统做接口,进行数据的采集,并转换为自身可以识别的数据在远程会诊的过程中提供给受邀方查阅,非常必要。医疗信息系统软件界面通常表现为窗口表格形式,一般针对固定结构的表格数据抓取,较为常见地是通常利用模板表格图把固定单元的相对位置描述出来,作为表格结构的先验信息,然后利用这些信息指导数据提取,可以大大提高表格数据提取的准确率和速度,方便批量化处理。然而不同厂家设计的医疗信息系统软件界面存在有很大不同,由于表格结构复杂多样,很难找到一种通用的提取框架,而且 资料传输过来的数据存在很多重复的数据,无用的数据,错误的数据,导致数据的不完整性,无法具体完成数据的结构化和清晰化,使得数据展示和分析难度很大。
发明内容
为了解决现有技术的问题,本发明提供了一种基于GDI拦截的表格识别方法。 本发明具体技术方案在于,包括如下步骤:
a)根据系统对表格的窗体进行定位;
b)配置GDI抓取窗体内表格的文本和线条,利用windows API钩挂,用GDI函数对系统进行拦截文本和线条;
c)配置排除异常线条,对表格的多余线条进行排除;
d)配置识别边框或者自定义边框,对表格边框进行识别和或者自定义边框;
e) 还原系统表格文本和表格格式;
f)配置单元格,获取单元格内文本内容。
进一步地,步骤f)所述单元格,支持无合并单元格和存在合并单元格。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙博为软件技术股份有限公司,未经长沙博为软件技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710149981.X/2.html,转载请声明来源钻瓜专利网。