[发明专利]信息处理方法及装置、电子设备和计算机可读存储介质在审
申请号: | 201911072145.1 | 申请日: | 2019-11-05 |
公开(公告)号: | CN110781858A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 杨远琳;高英明;武迪;董楠;郭振 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F16/28 |
代理公司: | 72003 隆天知识产权代理有限公司 | 代理人: | 章侃铱;石海霞 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 药品信息 药品数据库 目标图像 药品属性 信息块 图像 信息处理 存储 计算机可读存储介质 模式识别技术 信息处理装置 电子设备 获取目标 数据列 构建 场景 应用 | ||
本公开是关于一种信息处理方法、信息处理装置、电子设备以及计算机可读存储介质,涉及模式识别技术领域,可以应用于从包含药品信息的图像中提取药品属性信息的场景。该信息处理方法包括:获取目标图像,并确定目标图像对应的结构特征;其中,目标图像包括药品信息对应的图像;根据结构特征确定目标图像中的多个信息块;从多个信息块中分别获取各信息块对应的药品属性信息;其中,药品属性信息包括属性名称和属性值;将各属性名称对应的属性值分别存储到药品数据库中相应的数据列。本公开可以从包含药品信息的图像中提取出药品信息,并将提取出的药品信息存储到药品数据库中,以构建药品数据库。
技术领域
本公开涉及模式识别技术领域,具体而言,涉及一种信息处理方法、信息处理装置、电子设备以及计算机可读存储介质。
背景技术
随着药品(也称药物)数量和种类的增多,构建一个可以存储各类药品信息的药品库成为亟待解决的问题,以便后续人们利用药品进行药品查询、保险理赔、药品购买等各类行为。
目前,搜集药品信息主要通过光学字符识别(Optical Character Recognition,OCR)信息提取以及从各类药品网站爬取相关信息的方式进行。
具体的,采用OCR信息提取的方式搜集药品信息时,先利用OCR技术提取说明书上的内容,再将提取内容做结构化分类处理。而从各类药品网站爬取相关信息的方式,是将爬取到的药品信息进行处理后存储到药品库中。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种信息处理方法、信息处理装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服采用传统药品信息提取方法导致药品信息提取效果不佳、搜集药品信息量有限以及信息准确度存疑的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本公开的第一方面,提供一种信息处理方法,包括:获取目标图像,并确定目标图像对应的结构特征;其中,目标图像包括药品信息对应的图像;根据结构特征确定目标图像中的多个信息块;从多个信息块中分别获取各信息块对应的药品属性信息;其中,药品属性信息包括属性名称和属性值;将各属性名称对应的属性值分别存储到药品数据库中相应的数据列。
可选的,获取目标图像,包括:获取包含所述药品信息的初始图像;对初始图像进行位置调整处理和模式调整处理后形成目标图像。
可选的,结构特征包括多个子结构特征,根据结构特征确定目标图像中的多个信息块,包括:确定各子结构特征分别对应的特征参数;根据多个特征参数对目标图像进行划分处理以形成多个有序子图像;确定目标图像中的标签标识;其中,标签标识用于确定信息块;根据标签标识将多个有序子图像划分为多个信息块。
可选的,根据标签标识将多个有序子图像划分为多个信息块,包括:获取一子图像作为当前子图像;如果当前子图像不包含标签标识,则将当前子图像合并至上一子图像,以形成当前子图像;如果当前子图像包含标签标识,则判断下一子图像是否包括标签标识;如果下一子图像包括标签标识,则将当前子图像作为信息块。
可选的,从多个信息块中分别获取各信息块对应的药品属性信息,包括:确定一信息块;其中,信息块包括标签标识;对信息块进行扫描识别处理,以确定信息块对应的信息内容;将标签标识中的信息内容作为属性名称;将信息块中除标签标识以外的信息内容作为属性值。
可选的,将各属性名称对应的属性值分别存储到药品数据库中相应的数据列,包括:获取训练后的属性分类模型,将药品属性信息输入至属性分类模型;基于属性分类模型对药品属性信息进行分类处理;获取属性分类模型输出的与药品属性信息对应的类别标识;其中,类别标识用于确定数据列;根据类别标识将属性值存储到数据列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911072145.1/2.html,转载请声明来源钻瓜专利网。