[发明专利]菜名识别方法和装置在审
申请号: | 201910111962.7 | 申请日: | 2019-02-12 |
公开(公告)号: | CN111563376A | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 徐光伟;赵鹏;李辰;包祖贻;刘恒友;李林琳 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 钱秀茹 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 方法 装置 | ||
本申请公开了菜名识别方法和装置。其中,菜名识别方法包括:获取待识别的原始菜名;通过语言模型,确定所述原始菜名包括的至少一个词的上下文相关词向量;所述语言模型至少从未标注菜名信息的第一原始菜名集中学习得到;通过菜名识别模型,根据所述上下文相关词向量识别与所述原始菜名对应的菜名;所述菜名识别模型从已标注菜名信息的第二原始菜名集中学习得到。采用这种处理方式,使得通过从少量人工标注数据集中学习到的菜名识别模型即可较好识别海量原始菜名的菜名,避免大量人力和时间对原始菜名进行菜名标注;因此,可以有效兼顾较低人工标注成本及较高菜名识别准确度两个方面。
技术领域
本申请涉及自然语言处理技术领域,具体涉及菜名识别方法和装置。
背景技术
在本地生活服务O2O业务场景中,一方面允许商家自由编辑菜品名称以吸引顾客,如“京酱肉丝打包”、“京酱肉丝盖饭”等等菜名;另一方面,要通过菜名识别技术自动为海量的菜品名称作归一化(标准化)处理,如“京酱肉丝打包”对应的真实菜品为“京酱肉丝”,“京酱肉丝盖饭”对应的真实菜品就是“京酱肉丝盖饭”本身,以便于在标准化的菜品名称上进行搜索、推荐等数据处理。
一种典型的菜名识别方法如下所述。通过序列标注的机器学习方式,从有标注的菜品名称数据集中学习得到菜名识别模型,再基于菜名识别模型自动为海量的菜品名称作菜名标准化处理。其中,有标注的菜品名称数据集包括原始菜名和标准化菜名间的对应关系。目前,对于菜品名称的标注方式主要为人工标注方式,即:利用人工逐条对海量原始菜名进行标准化菜名的标注。
然而,在实现本发明过程中,发明人发现该技术方案至少存在如下问题:1)由于通过人工对原始菜名进行菜名标注,菜名标注的准确率与标注人的经验有关,因此无法保证数据标注的准确率,从而影响菜名识别模型的准确度,进而影响菜名识别的准确度;2)由于需要大量人力和时间对原始菜名进行菜名标注,因此导致人工成本高,且数据标注效率低,使得无法及时更新菜名识别模型。
发明内容
本申请提供菜名识别方法,以解决现有技术存在的菜名识别准确度较低的问题。本申请另外提供菜名识别装置。
本申请提供一种菜名识别方法,包括:
获取待识别的原始菜名;
通过语言模型,确定所述原始菜名包括的至少一个词的上下文相关词向量;所述语言模型至少从未标注菜名信息的第一原始菜名集中学习得到;
通过菜名识别模型,根据所述上下文相关词向量识别与所述原始菜名对应的菜名;所述菜名识别模型从已标注菜名信息的第二原始菜名集中学习得到。
可选的,所述语言模型采用如下步骤学习得到:
获取所述第一原始菜名集;
构建所述语言模型的神经网络;
以语言模型对下一个词的预测概率小于概率阈值为训练目标,根据所述第一原始菜名集训练所述神经网络。
可选的,还包括:
若满足语言模型更新条件,则至少根据新增的第一原始菜名更新所述语言模型。
可选的,所述语言模型包括N-gram模型;所述词包括由N个相邻字构成的字串。
可选的,所述语言模型的网络结构包括以下网络结构的至少一个:双向长短时记忆网络,卷积神经网络,Transformer模型。
可选的,所述菜名识别模型采用如下步骤学习得到:
获取所述第二原始菜名集;
构建所述菜名识别模型的神经网络;
根据所述第二原始菜名集,训练所述神经网络。
本申请还提供一种菜名识别装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910111962.7/2.html,转载请声明来源钻瓜专利网。