[发明专利]托寄物品牌的识别方法及装置在审
申请号: | 202110303968.1 | 申请日: | 2021-03-22 |
公开(公告)号: | CN115114394A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 彭辰;朱静涛;王茹;谢茵;翟琳丽 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/08;G06Q30/02;G06Q10/08 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 官建红 |
地址: | 518000 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物品 识别 方法 装置 | ||
本申请提供一种托寄物品牌的识别方法及装置,该托寄物品牌的识别方法包括:获取托寄物的待识别托寄物介绍文本和第一品牌集;基于第一品牌集中各个第一品牌的品类文本确定各个第一品牌的第一品牌词向量;基于待识别托寄物介绍文本确定第二品牌词向量;基于第一品牌词向量和第二品牌词向量的相似度对第一品牌集中的品牌进行品牌筛选,得到托寄物的品牌识别结果。本申请一方面利用品牌对应的多个品类表示托寄物的品牌,另一方面利用待识别托寄物介绍文本表示托寄物的品牌,然后根据两种不同方式表达的品牌的相似度对第一品牌集中的品牌进行筛选,得到精确度更高的品牌识别结果,能够提高托寄物品牌识别准确度。
技术领域
本申请涉及自然语言处理和及机器学习技术领域,具体涉及一种托寄物品牌的识别方法及装置。
背景技术
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
在利用物流运单数据进行用户分析时,我们通常需要挖掘用户的品牌购买行为以洞察用户的购买力、消费品类偏好等。因此利用物流运单数据中的拖寄物介绍来挖掘当前托寄物所属品牌是唯一途径。此途径的难点在于,待识别托寄物介绍文本噪声很强,格式杂乱,很难准确提取品牌信息。现有的挖掘手段通常是直接模糊匹配品牌名,得到的信息准确率很低,托寄物品牌识别准确度较低。
也即,现有技术中托寄物品牌识别准确度较低。
发明内容
本申请旨在提供一种托寄物品牌的识别方法及装置,旨在解决现有技术中托寄物品牌识别准确度较低的问题。
一方面,本申请提供一种托寄物品牌的识别方法,所述识别方法包括:
获取所述托寄物的待识别托寄物介绍文本和第一品牌集;
基于所述第一品牌集中各个第一品牌的品类文本确定各个所述第一品牌的第一品牌词向量;
基于所述待识别托寄物介绍文本确定第二品牌词向量;
基于所述第一品牌词向量和所述第二品牌词向量的相似度对所述第一品牌集中的品牌进行品牌筛选,得到所述托寄物的品牌识别结果。
可选地,所述获取所述托寄物的待识别托寄物介绍文本和第一品牌集,包括:
获取预设语料库,其中,所述预设语料库包括预设品牌集和所述预设品牌集中各个品牌对应的品类文本;
基于所述预设语料库对所述待识别托寄物介绍文本进行分词,得到待识别托寄物介绍分词集;
对所述待识别托寄物介绍分词集和所述预设品牌集求交集,得到第二品牌集;
基于所述第二品牌集确定所述第一品牌集。
可选地,所述基于所述第一品牌词向量和所述第二品牌词向量的相似度对所述第一品牌集中的品牌进行品牌筛选,得到所述托寄物的品牌识别结果,包括:
计算所述第一品牌词向量和所述第二品牌词向量的相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110303968.1/2.html,转载请声明来源钻瓜专利网。