[发明专利]一种车辆配件名称自动标准化方法和装置在审
申请号: | 201910881128.6 | 申请日: | 2019-09-18 |
公开(公告)号: | CN112613319A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 杭州联保致新科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/284;G06Q40/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310000 浙江省杭州市拱墅区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 车辆配件 名称 自动 标准化 方法 装置 | ||
1.一种车辆配件名称自动标准化方法和装置,其特征在于,所述的车辆配件名称自动标准化方法包括:
当获取到待标准化的车辆配件名称时,对待标准化的车辆配件名称进行预处理;
利用分词工具划分待标准化的车辆配件名称,得到待标准化车辆配件名称的分词;
将所述车辆配件名称分词与预设车辆配件名称库对比,得到对比结果;
根据对比结果修正待标准化的车辆配件名称,使待标准化的车辆配件名称转化成标准化车辆配件名称。
2.如权利要求书1所述的车辆配件名称自动标准化方法,其特征在于,当获取到待标准化的车辆配件名称时,对待标准的车辆配件名称预处理的步骤包括:
将待标准的车辆配件名称文本删除多余空格,标准化字母、数字和符号的格式,统一转换成英文状态下的字母、数字和符号;
将待标准的车辆配件名称文本中的停顿词进行处理,如“哦”、“呢”,“的”等停顿词;
根据车辆配件名称标准化词库,将待标准的车辆配件名称文本中的歧义词进行处理,消除歧义;
如权利要求书1所述的车辆配件名称自动标准化方法,其特征在于,根据分词工具划分待标准化的车辆配件名称,得到待标准化车辆配件名称分词的步骤包括:
配置ICTCLAS分词工具的语义库,语义库中主要包含车辆配件名称相关的词语;
对预处理的车辆配件名称使用ICTCLAS分词工具进行分词,提取待标准的车辆配件名称中的分词;
如权利要求书1所述的车辆配件名称自动标准化方法,其特征在于,将所述车辆配件名称分词与预设车辆配件名称库对比,得到对比结果的步骤包括:
根据权利要求书3中关键词的优先级,依次与预先设定的关键词库,利用词向量Word2vec进行对比,得到待标准车辆配件名称每个分词的匹配;
对匹配到关键词的分词,根据阈值决定是否替换,大于阈值的分词进行替换,小于阈值的分词不做处理;
如权利要求书1所述的车辆配件名称自动标准化方法,其特征在于,根据所述对比结果修正所述待标准化的车辆配件名称,使待标准的车辆配件名称转化成标准化车辆配件名称的步骤包括;
根据权利要求书4,根据关键词替换分词,实现对所述待标准化车辆名称的修正;
合并分词形成待标准化的车辆配件名称,将其与预设车辆配件名称库进行检索,采用词向量Word2vec的方式,通过欧式距离计算待标准化车辆配件名称与预设车辆配件名称的相似度;
达到相似度阈值的待标准化车辆配件名称直接转化成标准化车辆配件名称,达不到相似度阈值的待标准化车辆配件名称转化成与预设车辆配件名称欧式距离最接近的标准化车辆配件名称;
一种车辆配件名称自动标准化装置,其特征在于,所述的车辆配件名称自动标准化装置包括:
车辆配件名称提取模块,用于获取到待标准化的车辆配件名称时,从待标准的车辆配件名称中提取关键词;
车辆配件名称划分模块,用于划分待标准化的车辆配件名称,得到待标准化车辆配件名称的分词;
车辆配件名称对比模块,用于车辆配件名称分词与预设车辆配件名称库对比,得到对比结果;
车辆配件名称补全模块,用于修正所述待标准化的车辆配件名称,使待标准的车辆配件名称转化成标准化车辆配件名称。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州联保致新科技有限公司,未经杭州联保致新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910881128.6/1.html,转载请声明来源钻瓜专利网。