[发明专利]数据处理方法、装置、电子设备及存储介质在审
申请号: | 201911215276.0 | 申请日: | 2019-12-02 |
公开(公告)号: | CN112992301A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 强晟 | 申请(专利权)人: | 金色熊猫有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F40/295 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 章侃铱;石海霞 |
地址: | 中国香港铜锣湾希慎*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 | ||
本公开实施例提供了一种数据处理方法、装置、电子设备及计算机可读存储介质,属于医疗数据技术领域,该数据处理方法包括:获取待处理数据;根据所述待处理数据中的属性信息确定所述待处理数据的类型;若所述待处理数据的类型为第一类型,则按照实体标注对所述待处理数据进行拆分,以得到拆分结果。本公开实施例能够提高数据拆分的效率和准确性。
技术领域
本公开实施例涉及医疗数据技术领域,具体而言,涉及一种数据处理方法、数据处理装置、电子设备及计算机可读存储介质。
背景技术
医疗数据可以包括结构化的、非结构化的以及影像数据。在对数据进行计算时,需要提取其中的关键内容,以将非结构化的数据转化为结构数据,从而用于计数据算。数据的拆分是数据结构化过程中的关键步骤。
相关技术中,一般使用人工方式来进行数据拆分。在这种方式中,工作效率较低且具有一定的依赖性和局限性。另外,对不存在标准标记(如序号和表格)的数据,人工可能无法确定其拆分位置,进而可能由于误操作而导致对数据的错误拆分,准确性和可靠性较差。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例的目的在于提供一种数据处理方法、数据处理装置、电子设备及计算机可读存储介质,进而至少在一定程度上克服数据拆分效率较低以及可靠性较差的问题。
本公开实施例的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本公开实施例的一个方面,提供一种数据处理方法,包括:获取待处理数据;根据所述待处理数据中的属性信息确定所述待处理数据的类型;若所述待处理数据的类型为第一类型,则按照实体标注对所述待处理数据进行拆分,以得到拆分结果。
在本公开的一种示例性实施例中,按照实体标注对所述待处理数据进行拆分,以得到拆分结果包括:对所述待处理数据进行标注,以得到包括实体和分隔实体的标注结果;根据所述标注结果对所述待处理数据进行拆分,以得到所述拆分结果。
在本公开的一种示例性实施例中,根据所述标注结果对所述待处理数据进行拆分,以得到所述拆分结果包括:根据所述标注结果中的所述分隔实体确定拆分标记,并按照所述拆分标记对所述待处理数据进行拆分,以得到所述拆分结果。
在本公开的一种示例性实施例中,对所述待处理数据进行标注,以得到包括实体和分隔实体的标注结果包括:通过训练好的序列标注模型对所述待处理数据进行自动标注,以得到所述标注结果。
在本公开的一种示例性实施例中,所述训练好的序列标注模型是通过历史数据以及所述历史数据的真实标注结果,对序列标注模型进行训练后得到的。
在本公开的一种示例性实施例中,所述方法还包括:若所述待处理数据的类型为第二类型,则按照编号规则对所述待处理数据进行拆分,以确定拆分结果。
在本公开的一种示例性实施例中,按照编号规则对所述待处理数据进行拆分,以确定拆分结果包括:对所述待处理数据中的编号模式进行枚举,若确定至少两个以上的编号正确,则在所述编号模式下按照所述编号对所述待处理数据进行拆分,以确定所述拆分结果。
根据本公开的一个方面,提供一种数据处理装置,包括:数据获取模块,用于获取待处理数据;类型确定模块,用于根据所述待处理数据中的属性信息确定所述待处理数据的类型;数据拆分模块,用于若所述待处理数据的类型为第一类型,则按照实体标注对所述待处理数据进行拆分,以得到拆分结果。
根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述的数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金色熊猫有限公司,未经金色熊猫有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911215276.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于拆卸安装的汽车前防撞外板
- 下一篇:流量控制方法、装置及设备