[发明专利]一种汽车配件名称分词方法和系统在审
申请号: | 202210044718.5 | 申请日: | 2022-01-14 |
公开(公告)号: | CN114429130A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 施铭铮;尹业光;胡银扬 | 申请(专利权)人: | 福建众创车联网络科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 程劲竹 |
地址: | 361000 福建省厦门市思*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 汽车配件 名称 分词 方法 系统 | ||
1.一种汽车配件名称分词方法,其特征在于,包括以下步骤:
步骤一、创建配件名列表
人工标注创建配件名列表;
步骤二、创建包含关系图
对创建的配件名列表按配件名长度排序,并创建一个初始状态为空的已处理的配件名列表;对已排序的配件名列表中每个配件名执行以下操作:
寻找包含关系;生成有向无环图;设置权重,根据动态规划算法在所有路径中寻找最优路径,更新包含关系图,得到执行的配件名的分词结果;
将当前执行的配件名加入到已处理的配件名列表,并将已排序的配件名列表中全部配件名进行一个循环,完成配件名的包含关系图创建;
步骤三、使用包含关系图
使用创建后的配件名的包含关系图对配件商品名称进行分词。
2.如权利要求1所述的汽车配件名称分词方法,其特征在于:所述配件名列表中配件名由两个或两个以上的字组成,且一个配件名对应一个汽车配件类别。
3.如权利要求2所述的汽车配件名称分词方法,其特征在于:寻找包含关系时,对于当前循环到的配件名,在已处理的配件名列表中查找包含当前循环到的配件名的所有配件名,并标记为当前循环到的配件名的子列表,包括以下步骤:
获取已排序的配件名列表中当前执行的配件名,判断当前执行的配件名的长度;当前执行的配件名长度为2时定义为基础配件名并添加至已处理配件名列表;当前执行的配件名长度大于2时,在已排序的配件名列表中查询包含所述当前执行的配件名的所有配件名,生成所述当前执行的配件名的子列表。
4.如权利要求3所述的汽车配件名称分词方法,其特征在于:所述配件名列表按配件名的长度由短到长排列,配件名长度为2的基础配件名添加至已处理配件名列表,在长度大于2的配件名执行时,已处理配件名列表中已包含所有的长度为2的配件名,在已包含所有的长度为2的配件名的已处理配件名列表中查找包含当前循环到的长度大于2的配件名的所有配件名。
5.如权利要求4所述的汽车配件名称分词方法,其特征在于:生成有向无环图时,根据生成的配件名的子列表生成一个有向无环图,包括以下步骤:
对当前执行的配件名的子列表中配件名的每个字设置一个ID,并在每个配件名的结尾添加一个ID作为结束标识;将配件名中的ID作为有向无环图的点,子列表中的每个配件名作为当前执行的配件名的有向无环图中的一个边,构建生成所述当前执行的配件名的有向无环图。
6.如权利要求5所述的汽车配件名称分词方法,其特征在于:设置权重为对生成的有向无环图中每条边设置权重,包括以下步骤:
根据单调递减函数按顺序对当前执行的配件名中的每个字设置权重,并获得包含当前执行的配件名中所有字的权重平均值;
获得的权重平均值与对应配件名设置的长度权重值的计算结果作为总权重。
7.如权利要求6所述的汽车配件名称分词方法,其特征在于:动态规划算法在所有路径中依据总权重寻找最优路径,总权重最高的路径为最优路径,其中,一条路径的总权重为该路径所包含的所有边的权重之和。
8.如权利要求7所述的汽车配件名称分词方法,其特征在于:更新包含关系图时,动态规划算法计算出最优路径后,得到当前执行的配件名的分词结果,将分词结果保存在包含关系图中;其中,配件名的权重与配件名的长度成正比关系。
9.如权利要求8所述的汽车配件名称分词方法,其特征在于:使用包含关系图时,对配件商品名称进行分词的步骤为:
获取一个给定的配件商品名称,通过寻找包含关系寻找包含于配件商品名称中的所有配件名,通过生成有向无环图生成给定的配件商品名称的有向无环图,通过设置权重来设置有向无环图中各条边的权重,通过动态规划算法寻找给定的配件商品名称的最优路径,得到的最优路径为给定的配件商品名称的分词的结果。
10.一种汽车配件名称分词系统,其特征在于:所述汽车配件名称分词系统采用权利要求1-9中任意一项所述汽车配件名称分词方法对汽车配件商品名称进行分词;所述汽车配件名称分词系统包括:
配件名列表创建模块,用于通过人工标注方式创建配件名列表;
包含关系图创建模块,用于对按配件名长度排序的配件名列表中每个配件名执行寻找包含关系,生成有向无环图,设置权重,根据动态规划算法在所有路径中寻找最优路径,更新包含关系图,得到执行的配件名的分词结果的操作,还用于将当前执行的配件名加入到创建的一个初始状态为空的已处理的配件名列表中,并将已排序的配件名列表中全部配件名进行一个循环,完成配件名的包含关系图创建;以及
包含关系图使用模块,用于使用创建后的配件名的包含关系图对配件商品名称进行分词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建众创车联网络科技有限公司,未经福建众创车联网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210044718.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种离子型稀土矿山除杂渣的处理方法
- 下一篇:一种粉体输送装置