[发明专利]数据标准化的方法以及标准化模型的生成方法及装置在审
申请号: | 202111196678.8 | 申请日: | 2021-10-14 |
公开(公告)号: | CN113849607A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 李海丽;史晨阳;王磊;黄登玺;潘学芳;林勇;金佩;王宇宸;乔佳丽 | 申请(专利权)人: | 中国光大银行股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F16/31 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张静 |
地址: | 100033 北京市西城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 标准化 方法 以及 模型 生成 装置 | ||
本发明实施例公开了一种数据标准化的方法,包括:获取待标准化对象的中文名称,在预设的标准知识库中搜索与所述待标准化对象的中文名称相关的标准用语;所述标准知识库中包括标准单词库、标准域库和标准用语库;若在标准知识库中搜索到与所述中文名称相关的标准用语,则获取所述标准用语对应的标准数据信息;利用所述标准数据信息对所述标准化对象进行修正。这样将标准化的方法落地,实现了对数据进行自动标准化处理的过程,提升了数据处理的效率,解决了现有技术中人工操作导致的工作量大、效率低的问题。
技术领域
本发明涉及数据处理领域,尤其涉及一种数据标准化的方法以及标准化模型的生成方法及装置。
背景技术
在大数据时代,数据的价值得到了人们的广泛的认同,数据正在成为数字经济时代最重要的战略性资产,科学的数据管理可以把数据变成生产要素。但是,目前数据存在质量低下、数据缺乏标准无法共享等问题,这样就无法发挥数据应有的价值。
为了解决上述问题,有人提出了一些数据标准,但是这些数据标准仅供参考和查询,无法落地实施,而且需要人工进行标准的核对,工作量大、效率低,而且面临巨大的数据量,人工操作是无法真正的实现数据的标准化的。
发明内容
有鉴于此,本发明实施例公开了一种数据标准化的方法,实现了对数据进行自动标准化处理的过程,提升了数据处理的效率,解决了现有技术中人工操作导致的工作量大、效率低的问题。
本发明实施例公开了一种数据标准化的方法,包括:
获取待标准化对象的中文名称;
在预设的标准知识库中搜索与所述待标准化对象的中文名称相关的标准用语;所述标准知识库中包括标准单词库、标准域库和标准用语库;
若在标准知识库中搜索到与所述中文名称相关的标准用语,则获取所述标准用语对应的标准数据信息;
利用所述标准数据信息对所述标准化对象进行修正。
可选的,所述在预设的标准知识库中搜索与所述标准化对象的中文名称相关的标准用语,包括:
使用所述待标准化对象的中文名称在所述标准知识库中进行搜索;
若搜索到与所述中文名称一致的用语,将搜索到的与所述中文名称一致的用语作为与所述中文名称相关的标准化用语。
可选的,所述在预设的标准知识库中搜索与所述标准化对象的中文名称相关的标准用语,包括:
在预设的标准知识库中搜索所述中文名称的别名;
若搜索到所述中文名称的别名,则将搜索到的所述中文名称的别名作为与所述中文名称相关的标准化用语。
可选的,所述在预设的标准知识库中搜索与所述标准化对象的中文名称相关的标准用语,包括:
对所述中文名称进行分词处理,得到单词列表;
若所述单词列表中的单词均包含在预设的标准知识库或者非标准知识库中,将所有单词列表中的单词按照不同顺序进行组合,得到至少一个组合用语;
利用所述组合用语在所述标准知识库中进行搜索;
若在所述标准知识库中搜索到任何一个组合用语,将搜索到的组合用语作为所述中文名称的标准化用语。
可选的,在将所有单词列表中的单词按照不同顺序进行组合之前,还包括:
针对所述单词列表中的任何一个目标单词,若所述目标单词在所述非标准单词库中,获取所述目标单词对应的标准单词;
采用标准单词替换所述单词列表中的目标单词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国光大银行股份有限公司,未经中国光大银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111196678.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗压阻燃型纸箱及其制备方法
- 下一篇:麻醉气道辅助管理器械底座
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置