[发明专利]数据库表的外键映射方法、装置、电子设备和存储介质在审
申请号: | 202010350411.9 | 申请日: | 2020-04-28 |
公开(公告)号: | CN111680506A | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 袁鹏文;刘强;胡婧 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06K9/62;G06F16/33;G06F16/22 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 映射 方法 装置 电子设备 存储 介质 | ||
1.一种数据库表的外键映射方法,其特征在于,包括:
获取目标字段的字段信息;
对所述字段信息进行自然语言处理,得到所述字段信息的文本特征;
根据关联对象分类模型和所述文本特征,确定所述目标字段的关联对象;
建立所述目标字段与所述关联对象的数据库表的外键映射关系。
2.根据权利要求1所述的数据库表的外键映射方法,其特征在于,所述对所述字段信息进行自然语言处理,得到所述字段信息的文本特征包括:
对所述字段信息进行分词处理,以得到分词结果;
提取所述分词结果中的特征值,根据所述特征值确定所述字段信息的文本特征。
3.根据权利要求2所述的数据库表的外键映射方法,其特征在于,所述字段信息包括字段名,所述对所述字段信息进行分词处理,以得到分词结果包括:
按照预设的字段命名格式对所述字段名进行分词处理,得到多个词;
所述提取所述分词结果中的特征值包括:
对得到的各词分别提取所述特征值。
4.根据权利要求1所述的数据库表的外键映射方法,其特征在于,所述目标字段为Hadoop数据仓库中的事实表的维度字段,所述关联对象为Hadoop数据仓库中的维度表的实体。
5.根据权利要求1所述的数据库表的外键映射方法,其特征在于,所述关联对象分类模型包括决策树分类模型。
6.根据权利要求1所述的数据库表的外键映射方法,其特征在于,所述关联对象包括门店实体、项目实体以及销售实体,所述根据关联对象分类模型和所述文本特征,确定目标字段的关联对象包括:
若确定所述目标字段的关联对象为实体,则确定所述实体是否为所述门店实体;
若所述实体不是所述门店实体,则确定所述实体是否为所述项目实体;
若所述实体不是所述项目实体,则确定所述实体是否为所述销售实体。
7.根据权利要求1至6中任一项所述的数据库表的外键映射方法,其特征在于,所述方法还包括:
获取数据测试请求,所述数据测试请求包括待测试字段;
根据所述数据测试请求,读取所述待测试字段中的数据和所述待测试字段的外键映射关系;
根据所述外键映射关系确定目标数据库表,若读取的数据存在于所述目标数据库表中,则测试通过。
8.一种数据库表的外键映射装置,其特征在于,包括:
第一获取单元,用于获取目标字段的字段信息;
特征提取单元,用于对所述字段信息进行自然语言处理,得到所述字段信息的文本特征;
确定单元,用于根据关联对象分类模型和所述文本特征,确定所述目标字段的关联对象;
建立单元,用于建立所述目标字段与所述关联对象的数据库表的外键映射关系。
9.一种电子设备,其中,该电子设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如权利要求1至7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010350411.9/1.html,转载请声明来源钻瓜专利网。