[发明专利]一种制造商名称识别方法、装置、电子设备及可读介质在审
申请号: | 202110938511.8 | 申请日: | 2021-08-16 |
公开(公告)号: | CN113627173A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 林颖朝;谢国清 | 申请(专利权)人: | 深圳市云采网络科技有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/126;G06F40/151;G06Q10/08;G06N20/00 |
代理公司: | 北京布瑞知识产权代理有限公司 11505 | 代理人: | 李浩 |
地址: | 518052 广东省深圳市南山区前海深港合作区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 制造商 名称 识别 方法 装置 电子设备 可读 介质 | ||
本申请公开了一种制造商名称识别方法、装置、电子设备及可读介质。方法包括:从物料清单文件中获取与电子元件的制造商对应的元件文本;对元件文本进行预处理,得到电子元件的元件文本;对元件文本进行分词,得到至少一个关键词;以及根据每个关键词确定电子元件的标准制造商名称。本申请提供的方案能够更精确地识别BOM文件中的制造商名称。
技术领域
本申请涉及识别技术领域,具体涉及一种制造商名称识别方法、装置、电子设备及可读介质。
背景技术
随着互联网技术的发展,越来越多的厂家开始通过互联网上的元器件采购平台来进行元器件的采购。通常厂家在进行采购时,根据自己需要的元器件的信息生成物料清单(Bill of Material,BOM)文件,将BOM文件导入元器件采购平台进行识别,从而得到所需要的元器件的购买详情。
然而,现有的元器件采购平台在通过BOM文件中元器件的制造商进行识别的时候,只有在BOM文件中的制造商名称完全无误的时候才能搜索到,若厂家在生成BOM文件前输入制造商名称时出现了格式错误或者字符错误,则无法成功进行识别,影响元器件的采购。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种制造商名称识别方法、装置、电子设备及可读介质,能够更精确地识别BOM文件中的制造商名称。
根据本申请的一个方面,提供了一种制造商名称识别方法,包括:从物料清单文件中获取与电子元件的元件文本;对所述元件文本进行预处理;对预处理后的所述元件文本进行分词,得到至少一个关键词;以及根据每个所述关键词确定所述电子元件的标准制造商名称。
在一实施例中,所述对所述元件文本进行预处理包括:对所述元件文本进行编码转换;和/或根据预设的允许字符库,将所述元件文本中的非允许字符进行替换;和/或将所述元件文本中的字母字符统一修改为大写或小写;和/或将所述元件文本中的全角字符转换为半角字符。
在一实施例中,所述对所述元件文本进行预处理包括:对所述元件文本进行编码转换;其中,所述对所述元件文本进行编码转换包括:确定所述元件文本的特征信息;将所述特征信息输入预先训练的编码识别模型中,该编码识别模型通过作为输入的样本编码的特征信息与作为输出的样本识别结果,训练得到;确定所述编码识别模型的识别结果;以及当所述识别结果为非标准编码时,对所述元件文本进行编码转换处理。
在一实施例中,所述编码识别模型通过如下方式进行训练:获取标准编码特征信息样本集和非标准编码特征信息样本集;其中,所述样本标准编码特征信息样本集中包括标准编码对应的至少一个特征信息,所述非标准编码特征信息样本集中包括非标准编码对应的至少一个特征信息;以及利用标准编码特征信息样本集和非标准编码特征信息样本集对所述编码识别模型进行训练;其中,在将所述标准编码特征信息样本集作为所述编码识别模型的输入时,将标准编码作为识别结果作为所述编码识别模型的输出;在将所述非标准编码特征信息样本集作为所述编码识别模型的输入时,将非标准编码作为识别结果作为所述编码识别模型的输出。
在一实施例中,所述对预处理后的所述元件文本进行分词,得到至少一个关键词包括:根据分词库对所述元件文本进行分词,生成至少一个词汇,其中,所述分词库中包括至少一个标准词汇,其中,所述标准词汇为用于构成标准制造商名称的词汇;将所述词汇以及与所述词汇对应的标准词汇进行相似度计算;以及将相似度大于预设阈值的词汇作为关键词。
在一实施例中,在所述得到至少一个关键词之后,所述制造商的识别方法还包括:针对每个所述关键词,执行:确定当前关键词中是否包括非标准参数字符;当所述当前关键词中包括所述非标准参数字符时,确定所述当前关键词的参数类型;根据所述参数类型对应的标准参数字符库,将所述非标准参数字符替换为标准参数字符,其中,所述标准参数字符库中包括至少一个标准参数字符对应的至少一个非标准参数字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市云采网络科技有限公司,未经深圳市云采网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110938511.8/2.html,转载请声明来源钻瓜专利网。