[发明专利]数据存储方法、装置、存储介质及电子设备在审
申请号: | 201911276721.4 | 申请日: | 2019-12-12 |
公开(公告)号: | CN111125100A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 贾弼然;顾文剑;崔朝辉 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G16H10/60 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 魏嘉熹 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 存储 方法 装置 介质 电子设备 | ||
本公开涉及一种数据存储方法、装置、存储介质及电子设备,以在生成的结构化数据存在错误时,更加方便快捷地修正错误,从而提高数据存储的效率和正确率。该方法应用于服务器,包括:接收客户端发送的待存储的目标文本;将目标文本输入到数据转换模型中进行处理,得到目标文本的结构化数据;将目标文本的结构化数据发送给数据库进行存储;其中,数据转换模型用于通过如下方式对目标文本进行处理:针对目标文本中的每个单句,在多个样本单句中确定与该单句最相似的目标单句;获取目标文本中每个单句分别对应的目标单句的预设结构化数据;根据目标文本中单句对应的目标单句的预设结构化数据,确定该单句的结构化数据。
技术领域
本公开涉及数据处理技术领域,具体地,涉及一种数据存储方法、装置、存储介质及电子设备。
背景技术
随着计算机技术的不断发展,可以将各种各样的数据存储到数据库进行管理。由于数据库中存储的数据为结构化数据,因此在将数据存储到数据库之前,需要对数据进行结构化处理。
相关技术中,主要是训练命名实体识别模型和关系识别模型,然后根据训练得到的模型进行计算以识别出数据的实体和关系,最后根据得出的结果进行数据结构化。按照此种方式,如果计算结果存在明显的错误,则需要重新获取样本数据进行模型训练。
发明内容
本公开的目的是提供一种数据存储方法、装置、存储介质及电子设备,以在生成的结构化数据存在错误时,更加方便快捷地修正错误,从而提高数据存储的效率和正确率。
为了实现上述目的,第一方面,本公开提供一种数据存储方法,应用于服务器,包括:
接收客户端发送的待存储的目标文本;
将所述目标文本输入到数据转换模型中进行处理,得到所述目标文本的结构化数据,所述结构化数据至少用于表征分词以及该分词的语义类型间的对应关系;
将所述目标文本的结构化数据发送给数据库进行存储;
其中,所述数据转换模型包括多个样本单句,所述多个样本单句中的每个样本单句对应有预设结构化数据,所述数据转换模型用于通过如下方式对所述目标文本进行处理:
针对所述目标文本中的每个单句,在所述多个样本单句中确定与所述单句最相似的目标单句;
获取所述目标文本中每个单句分别对应的目标单句的预设结构化数据;
根据所述目标文本中单句对应的目标单句的预设结构化数据,确定所述单句的结构化数据。
可选地,根据所述目标文本中单句对应的目标单句的预设结构化数据,确定所述单句的结构化数据,包括:
若所述预设结构化数据中的各分词在所述单句中均具有对应相同的分词,则将所述预设结构化数据作为所述单句的结构化数据;
若所述预设结构化数据中的目标分词在所述单句中不具有对应相同的分词,则在所述预设结构化数据中删除所述目标分词以及所述目标分词对应的语义类型,并将删除后的预设结构化数据作为所述单句的结构化数据。
可选地,在所述预设结构化数据中删除所述目标分词以及所述目标分词对应的语义类型,包括:
确定所述单句中是否存在包含所述目标分词部分字符的匹配分词;
若所述单句中不存在所述匹配分词,则在所述预设结构化数据中删除所述目标分词以及所述目标分词对应的语义类型;
若所述单句中存在所述匹配分词,则在所述预设结构化数据中将所述目标分词替换成所述匹配分词,并将替换后的预设结构化数据作为所述单句的结构化数据。
可选地,根据所述目标文本中单句对应的目标单句的预设结构化数据,确定所述单句的结构化数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911276721.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置