[发明专利]目标字段的确定方法、装置、存储介质及电子装置有效
申请号: | 201910741181.6 | 申请日: | 2019-08-12 |
公开(公告)号: | CN110457704B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 宋柯 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06K9/62 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 江舟 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 字段 确定 方法 装置 存储 介质 电子 | ||
1.一种目标字段的确定方法,其特征在于,包括:
将原始数据表中的原始字段中的第一后缀词与标准数据表中的标准字段中的第二后缀词进行比对;
确定与所述第二后缀词相同的所述第一后缀词所对应的原始字段为第一字段,与所述第一后缀词相同的所述第二后缀词所对应的标准字段为第二字段;
使用第一相似度模型和第二相似度模型分别对第一目标字段和第二目标字段进行相似度计算,以得到第一相似度和第二相似度,其中,所述第一目标字段是所述第一字段去除所述第一后缀词后得到的字段,所述第二目标字段是所述第二字段去除所述第二后缀词后得到的字段;
根据所述第一相似度和/或所述第二相似度确定所述原始数据表中的目标字段;
其中,使用所述第二相似度模型对所述第一目标字段和所述第二目标字段进行相似度计算,以得到所述第二相似度,包括:
如下公式计算所述第二相似度:
其中,
将所述相似度得分score确定为所述第二相似度。
2.根据权利要求1所述的方法,其特征在于,在所述使用第一相似度模型和第二相似度模型分别对第一目标字段和第二目标字段进行相似度计算,以得到第一相似度和第二相似度之前,所述方法还包括:
在所述第一字段中提取出所述第一目标字段,并对所述第一目标字段进行分词处理后,提取出所述第一目标词向量;以及,
在所述第二字段中提取出所述第二目标字段,并对所述第二目标字段进行分词处理后,提取出所述第二目标词向量。
3.根据权利要求2所述的方法,其特征在于,使用所述第一相似度模型对所述第一目标字段和所述第二目标字段进行相似度计算,以得到所述第一相似度,包括:
通过欧式距离算法确定所述第一目标词向量与所述第二目标词向量之间的欧式距离,并将所述欧式距离作为所述第一相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910741181.6/1.html,转载请声明来源钻瓜专利网。