[发明专利]一种基于图像处理的药方信息提取方法在审

专利信息
申请号: 202110850896.2 申请日: 2021-07-27
公开(公告)号: CN113554025A 公开(公告)日: 2021-10-26
发明(设计)人: 黄奎;敖银辉;覃耀鑫 申请(专利权)人: 广东工业大学
主分类号: G06K9/32 分类号: G06K9/32;G06K9/34;G06K9/36;G06K9/62
代理公司: 广东有知猫知识产权代理有限公司 44681 代理人: 赵皕
地址: 510006 广东省广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 图像 处理 药方 信息 提取 方法
【权利要求书】:

1.一种基于图像处理的药方信息提取方法,其特征在于,包括如下步骤:

S101、图像预处理:针对电子处方来源判断是否需要图像预处理,先对图像截取,把多余的背景去掉,然后使用投射变化原理矫正图片倾斜;

S201、霍夫直线检测:将图像中的细长直线进行消除,以防因此影响图像分列;

S301、图像像素分割:依据药方单上面的文字特征,并依据像素间隔,把图像进行分行与分列;

S401、ROI图像截取与ocr文字识别:利用分割好的行与列区域坐标,通过ROI截取出相应的图片块,并记录图片块位置,然后使用python开源的pytesseract模块对分割的相应图片块做文字识别,识别出来的文字会对应图片块中的位置;

S501、python正则化匹配信息提取:利用re模块实现对字符串的信息匹配,把图像块中识别出来的文字设置成字符串,并把药方中的关键信息按照需求提取出来;

S601、写入表格:将提取出来的模块按需求写进预先规定的表格保存到本地。

2.根据权利要求1所述的一种基于图像处理的药方信息提取方法,其特征在于,所述电子处方为药店上传的处方图片、患者上传的处方图片、医院通过接口推送的处方数据。

3.根据权利要求1所述的一种基于图像处理的药方信息提取方法,其特征在于,所述步骤S201中的霍夫直线检测设置有直线宽度及长度的阈值,当数据超过阈值时,则认定为不是文字,将其视为直线进行删除。

4.根据权利要求3所述的一种基于图像处理的药方信息提取方法,其特征在于,长度的低阀值为宽度的四分之一,间隔阀值为20个像素。

5.根据权利要求1所述的一种基于图像处理的药方信息提取方法,其特征在于,所述步骤S301中对二值化后的图片沿着图像的高对像素行进行扫描,记录当前行像素值为0的像素点个数,若像素点由无到有,则当前行可记为行首,由有到无,则当前行记为行末,由记录到的行首行末的位置,可从原图中截取相应的行;

对截取到的行图像,沿其宽方向进行像素点扫描,同样记录当前列像素值为0的像素点个数,若像素点由无到有,则当前行可记为文字列首,由有到无,则记当前列为文字列末,若是文字列末与下一文字列首间隔较小,在设置的阈值以内,则将其视为药单上的词组,如果超过阀值,则设为不同列,信息为不同内容的关键信息,以此来实现分行和分列。

6.根据权利要求1所述的一种基于图像处理的药方信息提取方法,其特征在于,所述步骤S501中提取的信息由部分信息及其他信息构成;其中,

所述部分信息通过匹配相应的名称和名称后面的“:”号,在“:”后面的信息,即为所需填入表格的相应信息;

所述其他信息为针对药方单的共性,在主要医药信息上一行会有“Rp”符号,结束会有“以下空白”几个字。

7.根据权利要求1所述的一种基于图像处理的药方信息提取方法,其特征在于,所述部分信息为姓名、性别、年龄、住址、处方编号、病历号、日期、医师,所述其他信息为药物名称、药物规格、用量、用法。

8.根据权利要求1所述的一种基于图像处理的药方信息提取方法,其特征在于,所述步骤S501利用正则化匹配“Rp”和“以下空白”,然后把中间的行认为是所需药物名称,药物规格,用量,用法部分信息,在每种药物名称前面有阿拉伯数字跟“.”,以此来标明第几个药物,药物规格跟药物名称在同一行,由于间隔比较大,分列时候分为不同列,同理,用量跟药物规格也同行不同列,用法另取一行,依据此特性,利用正则化匹配每一行的阿拉伯数字跟“.”,然后把相应顺序列归为药物名称,药物规格,用量,再下一行使用正则化匹配“用法:”,然后把这一行的所有内容归为用法这一属性,以匹配到“Rp”的下一次行开始,重复对每一行的信息进行提取生成相应字典,匹配到“以下空白”结束。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110850896.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top