[发明专利]菜品名称提取方法及装置有效
申请号: | 201811259894.0 | 申请日: | 2018-10-26 |
公开(公告)号: | CN109472025B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 邓哲宇 | 申请(专利权)人: | 口口相传(北京)网络技术有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/35;G06Q30/0282;G06Q50/12 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 王欢 |
地址: | 100102 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 菜品 名称 提取 方法 装置 | ||
本发明公开了一种菜品名称提取方法及装置。其中,方法包括:获取待提取的菜名字段;将待提取的菜名字段输入至预先训练得到的菜名预测模型中,其中,菜名预测模型为基于命名实体识别的预测模型;获取菜名预测模型输出的菜名预测结果,该菜名预测结果中包含有与待提取的菜名字段对应的至少一个候选菜品名称;根据至少一个候选菜品名称对应的菜名指标,确定与待提取的菜名字段对应的菜品名称。本方案通过命名实体识别的预测模型对菜名字段进行菜名预测,并根据预测结果确定最终的菜品名称,从而可充分结合菜名字段的上下文进行菜名提取,提高菜品名称的提取精度及提取效率;并且可避免现有技术中需构建庞大的菜品库而引起的人工成本高的弊端。
技术领域
本发明涉及计算机技术领域,具体涉及一种菜品名称提取方法及装置。
背景技术
随着科技及社会的不断进步,餐饮行业得以快速发展。菜品作为餐饮行业中一重要指标,关于其相关数据的研究也越来越受到人们重视。人们在对菜品数据进行分析的过程中,通常需从大量的菜品数据中分别提取出每条数据相应的菜品名称,基于提取出的菜品名称来进行菜品销量统计等菜品数据的分析。
然而,目前菜品的描述方式极其丰富,不同店铺,或同一店铺不同时期,又或者不同用户对同一菜品的描述方式均存在差异,从而增大菜品名称的提取难度。以菜品“红烧肉”为例,店铺A将该菜品描述为“大份红烧肉”,店铺B在某一时刻对其描述方式为“最正宗红烧肉”,而店铺B在另一时刻对其描述方式为“今日特价-红烧肉(必点)”,而用户C也可对该菜品进行评价“红烧肉一般般”。
为解决因菜品描述方式多样化而引起的菜品名称提取难度大的问题,申请公布号为CN108596789A的中国专利申请提供了一种菜品标准化方法,即预先构建一菜品库,根据菜品数据与菜品库中菜品名称的相似度,将菜品库中的某一菜品名称作为该条菜品数据所对应的菜品名称。然而,采用该方法,需人工构建庞大的菜品库,从而提高人工成本,降低菜品名称提取效率,且菜品库无法适应不断发展丰富的菜品数据;并且,该方法无法结合菜品信息的上下文语境,从而使得误判率较高;此外,CN108596789A中采用的相似度判断方法,易将名称相近但非同类菜品识别为同一菜品,如将辣椒炒肉与胡椒炒肉判定为同一菜品,从而降低菜品的提取精度。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的菜品名称提取方法及装置。
根据本发明的一个方面,提供了一种菜品名称提取方法,包括:
获取待提取的菜名字段;
将所述待提取的菜名字段输入至预先训练得到的菜名预测模型中,其中,所述菜名预测模型为基于命名实体识别的预测模型;
获取菜名预测模型输出的菜名预测结果;其中,所述菜名预测结果中包含有与所述待提取的菜名字段对应的至少一个候选菜品名称;
根据至少一个候选菜品名称对应的菜名指标,确定与所述待提取的菜名字段对应的菜品名称;其中,所述至少一个候选菜品名称对应的菜名指标包括:所述至少一个候选菜品名称对应的预测概率值、菜名长度、店铺数量、和/或订单数量。
可选的,所述将所述待提取的菜名字段输入至预先训练得到的菜名预测模型中进一步包括:
对所述待提取的菜名字段进行字符串分割,获得至少一个菜名子串;
将所述至少一个菜名子串分别输入至预先训练得到的菜名预测模型中。
可选的,所述对所述待提取的菜名字段进行字符串分割,获得至少一个菜名子串进一步包括:
根据分割符号对所述待提取的菜名字段进行字符串分割,获得至少一个菜名子串。
可选的,在所述将所述待提取的菜名字段输入至预先训练得到的菜名预测模型中之前,所述方法还包括:
获取菜名字段样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于口口相传(北京)网络技术有限公司,未经口口相传(北京)网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811259894.0/2.html,转载请声明来源钻瓜专利网。