[发明专利]一种制造商名称识别方法、装置、电子设备及可读介质在审
申请号: | 202110938511.8 | 申请日: | 2021-08-16 |
公开(公告)号: | CN113627173A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 林颖朝;谢国清 | 申请(专利权)人: | 深圳市云采网络科技有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/126;G06F40/151;G06Q10/08;G06N20/00 |
代理公司: | 北京布瑞知识产权代理有限公司 11505 | 代理人: | 李浩 |
地址: | 518052 广东省深圳市南山区前海深港合作区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 制造商 名称 识别 方法 装置 电子设备 可读 介质 | ||
1.一种制造商名称识别方法,其特征在于,包括:
从物料清单文件中获取与电子元件对应的元件文本;
对所述元件文本进行预处理;
对预处理后的所述元件文本进行分词,得到至少一个关键词;以及
根据每个所述关键词确定所述电子元件的标准制造商名称。
2.根据权利要求1所述的制造商名称识别方法,其特征在于,所述对所述元件文本进行预处理包括:
对所述元件文本进行编码转换;和/或
根据预设的允许字符库,将所述元件文本中的非允许字符进行替换;和/或
将所述元件文本中的字母字符统一修改为大写或小写;和/或
将所述元件文本中的全角字符转换为半角字符。
3.根据权利要求2所述的制造商名称识别方法,其特征在于,所述对所述元件文本进行预处理包括:
对所述元件文本进行编码转换;
其中,所述对所述元件文本进行编码转换包括:
确定所述元件文本的特征信息;
将所述特征信息输入预先训练的编码识别模型中,该编码识别模型通过作为输入的样本编码的特征信息与作为输出的样本识别结果,训练得到;
确定所述编码识别模型的识别结果;以及
当所述识别结果为非标准编码时,对所述元件文本进行编码转换处理。
4.根据权利要求3所述的制造商名称识别方法,其特征在于,所述编码识别模型通过如下方式进行训练:
获取标准编码特征信息样本集和非标准编码特征信息样本集;其中,所述样本标准编码特征信息样本集中包括标准编码对应的至少一个特征信息,所述非标准编码特征信息样本集中包括非标准编码对应的至少一个特征信息;以及
利用标准编码特征信息样本集和非标准编码特征信息样本集对所述编码识别模型进行训练;其中,在将所述标准编码特征信息样本集作为所述编码识别模型的输入时,将标准编码作为识别结果作为所述编码识别模型的输出;在将所述非标准编码特征信息样本集作为所述编码识别模型的输入时,将非标准编码作为识别结果作为所述编码识别模型的输出。
5.根据权利要求1所述的制造商名称识别方法,其特征在于,所述对预处理后的所述元件文本进行分词,得到至少一个关键词包括:
根据分词库对所述元件文本进行分词,生成至少一个词汇,其中,所述分词库中包括至少一个标准词汇,其中,所述标准词汇为用于构成标准制造商名称的词汇;
将所述词汇以及与所述词汇对应的标准词汇进行相似度计算;以及
将相似度大于预设阈值的词汇作为关键词。
6.根据权利要求1所述的制造商名称识别方法,其特征在于,在所述得到至少一个关键词之后,所述制造商的识别方法还包括:
针对每个所述关键词,执行:
确定当前关键词中是否包括非标准参数字符;
当所述当前关键词中包括所述非标准参数字符时,确定所述当前关键词的参数类型;
根据所述参数类型对应的标准参数字符库,将所述非标准参数字符替换为标准参数字符,其中,所述标准参数字符库中包括至少一个标准参数字符对应的至少一个非标准参数字符。
7.根据权利要求1所述的制造商名称识别方法,其特征在于,所述根据每个所述关键词确定所述电子元件的标准制造商名称包括:
将每个所述关键词作为搜索词输入预设的标准制造商名称库中进行检索,得到至少一个检索结果,每个检索结果对应一个标准制造商名称;
确定每个检索结果与所述元件文本的相似度得分;
将相似度得分最高的检索结果对应的标准制造商名称作为所述电子元件的标准制造商名称。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市云采网络科技有限公司,未经深圳市云采网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110938511.8/1.html,转载请声明来源钻瓜专利网。