[发明专利]一种基于图像处理的药方信息提取方法在审
申请号: | 202110850896.2 | 申请日: | 2021-07-27 |
公开(公告)号: | CN113554025A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 黄奎;敖银辉;覃耀鑫 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/36;G06K9/62 |
代理公司: | 广东有知猫知识产权代理有限公司 44681 | 代理人: | 赵皕 |
地址: | 510006 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 处理 药方 信息 提取 方法 | ||
1.一种基于图像处理的药方信息提取方法,其特征在于,包括如下步骤:
S101、图像预处理:针对电子处方来源判断是否需要图像预处理,先对图像截取,把多余的背景去掉,然后使用投射变化原理矫正图片倾斜;
S201、霍夫直线检测:将图像中的细长直线进行消除,以防因此影响图像分列;
S301、图像像素分割:依据药方单上面的文字特征,并依据像素间隔,把图像进行分行与分列;
S401、ROI图像截取与ocr文字识别:利用分割好的行与列区域坐标,通过ROI截取出相应的图片块,并记录图片块位置,然后使用python开源的pytesseract模块对分割的相应图片块做文字识别,识别出来的文字会对应图片块中的位置;
S501、python正则化匹配信息提取:利用re模块实现对字符串的信息匹配,把图像块中识别出来的文字设置成字符串,并把药方中的关键信息按照需求提取出来;
S601、写入表格:将提取出来的模块按需求写进预先规定的表格保存到本地。
2.根据权利要求1所述的一种基于图像处理的药方信息提取方法,其特征在于,所述电子处方为药店上传的处方图片、患者上传的处方图片、医院通过接口推送的处方数据。
3.根据权利要求1所述的一种基于图像处理的药方信息提取方法,其特征在于,所述步骤S201中的霍夫直线检测设置有直线宽度及长度的阈值,当数据超过阈值时,则认定为不是文字,将其视为直线进行删除。
4.根据权利要求3所述的一种基于图像处理的药方信息提取方法,其特征在于,长度的低阀值为宽度的四分之一,间隔阀值为20个像素。
5.根据权利要求1所述的一种基于图像处理的药方信息提取方法,其特征在于,所述步骤S301中对二值化后的图片沿着图像的高对像素行进行扫描,记录当前行像素值为0的像素点个数,若像素点由无到有,则当前行可记为行首,由有到无,则当前行记为行末,由记录到的行首行末的位置,可从原图中截取相应的行;
对截取到的行图像,沿其宽方向进行像素点扫描,同样记录当前列像素值为0的像素点个数,若像素点由无到有,则当前行可记为文字列首,由有到无,则记当前列为文字列末,若是文字列末与下一文字列首间隔较小,在设置的阈值以内,则将其视为药单上的词组,如果超过阀值,则设为不同列,信息为不同内容的关键信息,以此来实现分行和分列。
6.根据权利要求1所述的一种基于图像处理的药方信息提取方法,其特征在于,所述步骤S501中提取的信息由部分信息及其他信息构成;其中,
所述部分信息通过匹配相应的名称和名称后面的“:”号,在“:”后面的信息,即为所需填入表格的相应信息;
所述其他信息为针对药方单的共性,在主要医药信息上一行会有“Rp”符号,结束会有“以下空白”几个字。
7.根据权利要求1所述的一种基于图像处理的药方信息提取方法,其特征在于,所述部分信息为姓名、性别、年龄、住址、处方编号、病历号、日期、医师,所述其他信息为药物名称、药物规格、用量、用法。
8.根据权利要求1所述的一种基于图像处理的药方信息提取方法,其特征在于,所述步骤S501利用正则化匹配“Rp”和“以下空白”,然后把中间的行认为是所需药物名称,药物规格,用量,用法部分信息,在每种药物名称前面有阿拉伯数字跟“.”,以此来标明第几个药物,药物规格跟药物名称在同一行,由于间隔比较大,分列时候分为不同列,同理,用量跟药物规格也同行不同列,用法另取一行,依据此特性,利用正则化匹配每一行的阿拉伯数字跟“.”,然后把相应顺序列归为药物名称,药物规格,用量,再下一行使用正则化匹配“用法:”,然后把这一行的所有内容归为用法这一属性,以匹配到“Rp”的下一次行开始,重复对每一行的信息进行提取生成相应字典,匹配到“以下空白”结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110850896.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:全自动胶条风冷机
- 下一篇:真铝微孔特效透光结构及其的制作方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序