[发明专利]一种基于电子元器件采购BOM核价的表格预处理方法有效
申请号: | 202110069429.6 | 申请日: | 2021-01-19 |
公开(公告)号: | CN112712415B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 郑鑫;霍胜军;刘鹏飞;金旭东;高经纬 | 申请(专利权)人: | 青岛檬豆网络科技有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/22;G06F16/2457 |
代理公司: | 武汉聚信汇智知识产权代理有限公司 42258 | 代理人: | 刘丹 |
地址: | 266000 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 电子元器件 采购 bom 表格 预处理 方法 | ||
1.一种基于电子元器件采购BOM核价的表格预处理方法,其特征在于,包括:
步骤1,读入表格:判断表格中每个单元格的内容属性,并依据每个单元格的内容属性将每个单元格的内容以指定形式读入;
步骤2,合并单元格的处理:将表格的内容,转换成矩阵Z表示,矩阵Z的大小为M×N,其中M对应的是表格的行数,N对应的是表格的列数;
步骤3,矩阵Z的预处理:去除矩阵Z中的空白行、空白列、相同行、相同列以及相同行元素,而后得到矩阵X,此时矩阵X的大小为m×n,其中m表示矩阵X的行数,n表示矩阵X的列数;
步骤4,提取单元格特征:确定字段特征向量;
步骤5,确认表头和物料部分:确认有效矩阵及有无表头的属性特征;
步骤6,确认列属性:将提取的列属性分为三大类:产品确认的相关列、价格列、采购数量列;根据是否有表头,分别进入有表头确认列的部分进行列属性的确认或进入无表头确认列的部分进行列属性的确认;
步骤7,提取矩阵列字段的特征向量:确定列字段的特征向量;
步骤8,最终列确认:确认产品确认的相关列、最终价格列、最终数量列,并返回矩阵U;U由产品确认的相关列,最终价格列、最终数量列组成;
步骤4提取单元格特征,确定字段特征向量,包括如下步骤:
字段特征向量确定:F_cell=[cell1,cell2,cell3,cell4,cell5,cell6],其中cell1表示单元格中有无内容,cell2表示单元格中的汉字字段个数,cell3表示单元格中的英文字段个数,cell4表示单元格中的小数个数,cell5表示单元格中的整数个数,cell6表示单元格中其他字符的个数;字段特征向量提取步骤为:
步骤4.1:cell1的确定,cell1取值范围为{0,1};当cell1=0时,表示该字段内容为空,且确定该字段的特征向量为:F_cell=[0,0,0,0,0,0],无需向下继续提取特征向量的对应元素值;当cell1=1时,表示该字段内容不为空,则进入下一步骤,继续进行特征向量其他元素对应值的提取;
步骤4.2:cell2的确定,cell2取值范围为[0,+∞);以字段中所有非汉字的字符为分隔符,提取包含汉字的部分,将汉字字段的个数作为cell2的实际值,并将删除汉字部分的字段,作为下一步骤的输入;
步骤4.3:cell3的确定,cell3取值范围为[0,+∞);以字段中所有非英文、空格的字符为分隔符,提取包含英文的部分,将英文字段的个数作为cell3的实际值,并将删除英文部分的字段,作为下一步骤的输入;
步骤4.4:cell4,cell5的确认,cell4取值范围为[0,+∞),cell5取值范围为[0,+∞);提取字段中的数字部分,将包含小数点的小数个数作为cell4的实际值,将不包含小数点的整数个数作为cell5的实际值,将删除数字部分的字段,作为下一步骤的输入;
步骤五:cell6的确认,cell6的取值范围为[0,+∞);计算剩余字段的长度,即为cell6的实际值;
则由cell1,cell2,cell3,cell4,cell5,cell6实际值,构成的特征向量F_cell,即为该输入字段对应的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛檬豆网络科技有限公司,未经青岛檬豆网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110069429.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种太阳能发电用充电桩
- 下一篇:数据处理方法、装置、设备及存储介质