[发明专利]确定表字段的类型的方法和装置在审
申请号: | 201910043827.3 | 申请日: | 2019-01-17 |
公开(公告)号: | CN109784407A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 范叶亮;马云龙;卢周 | 申请(专利权)人: | 京东数字科技控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/22;G06F21/62 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;张效荣 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了确定表字段的类型的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:将表字段的原始特征划分为属性特征和值特征;对所述属性特征和值特征分别进行特征变换,确定变换后的转化特征;根据所述转化特征中的训练集训练神经网络;根据所述转换特征中的测试集和完成训练的神经网络进行深度学习,确定表字段的类型。该实施方式解决了现有技术基于关键词匹配和传统机器学习方法的识别准确率和召回率都相对较低、人工成本过高的技术缺陷,进而达到深度学习更有针对性、充分利用表字段的原始特征使得确定的表字段的类型更准确的技术效果。 | ||
搜索关键词: | 方法和装置 属性特征 原始特征 计算机技术领域 训练神经网络 关键词匹配 传统机器 技术缺陷 技术效果 人工成本 神经网络 特征变换 测试集 训练集 准确率 学习 转化 转换 | ||
【主权项】:
1.一种确定表字段的类型的方法,其特征在于,包括:将表字段的原始特征划分为属性特征和值特征;对所述属性特征和值特征分别进行特征变换,确定变换后的转化特征;根据所述转化特征中的训练集训练神经网络;根据所述转换特征中的测试集和完成训练的神经网络进行深度学习,确定表字段的类型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910043827.3/,转载请声明来源钻瓜专利网。