[发明专利]一种基于NLP技术的表名字段名智能补全方法有效
申请号: | 201910664540.2 | 申请日: | 2019-07-23 |
公开(公告)号: | CN110413972B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 徐金梦;金建良;吴林强;许琮浩 | 申请(专利权)人: | 杭州城市大数据运营有限公司;湖州市大数据运营有限公司;杭州中云数据科技有限公司 |
主分类号: | G06F40/18 | 分类号: | G06F40/18;G06F40/242;G06F40/284;G06F40/58 |
代理公司: | 杭州鼎乎专利代理事务所(普通合伙) 33377 | 代理人: | 黄勇 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于NLP技术的表名字段名智能补全方法,包括以下步骤;S1:预处理;S2:原始拆分;S3:查字典;S4:语言识别;S5:高级拆分;S6:补全推断;S7:输出翻译。本发明通过NLP技术和双重拆分验证将原始表的表名或字段名识别匹配,输出可能性结果,方便数据处理人快速判断了解表名或字段名含义,且输出结果可用于后续原始表内数据处理,增加数据处理人的工作速度,降低数据处理难度。 | ||
搜索关键词: | 一种 基于 nlp 技术 名字 段名 智能 方法 | ||
【主权项】:
1.一种基于NLP技术的表名字段名智能补全方法,其特征在于,包括以下步骤:S1:预处理;首先将表名或字段名中的英文或汉语拼音的大小写字母全部转换成小写字母,然后去掉数字等特殊字符,最后去掉只有一个字符的单词。S2:原始拆分;对预处理后的表名或字段名进行分割,英文单词和英文缩写根据标点符号和空格进行分割,汉语拼音则作为一个单词不做处理。S3:查字典;对英文查询字典,即根据英文词库中的英文单词和缩略语进行比对,判断查询的英文是否在字典中保存,若存在则取出,若不存在则继续后续步骤。S4:语言识别;对步骤3处理后的结果进行识别,判断其为英文还是汉语拼音。S5:高级拆分;对英文单词、英文缩写和汉语拼音连在一起的较长表名或字段名进行空格推断。S6:补全推断;对缺损的表名或字段名进行预测推断补全,还原表名或字段名的含义。S7:输出翻译;对预测补全后的表名或字段名进行输出整理,整理后可对英文表名或字段名进行翻译,输出为汉字形式。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州城市大数据运营有限公司;湖州市大数据运营有限公司;杭州中云数据科技有限公司,未经杭州城市大数据运营有限公司;湖州市大数据运营有限公司;杭州中云数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910664540.2/,转载请声明来源钻瓜专利网。