[发明专利]菜品名称提取方法及装置有效
申请号: | 201811259894.0 | 申请日: | 2018-10-26 |
公开(公告)号: | CN109472025B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 邓哲宇 | 申请(专利权)人: | 口口相传(北京)网络技术有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/35;G06Q30/0282;G06Q50/12 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 王欢 |
地址: | 100102 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 菜品 名称 提取 方法 装置 | ||
1.一种菜品名称提取方法,包括:
获取待提取的菜名字段;
将所述待提取的菜名字段输入至预先训练得到的菜名预测模型中,其中,所述菜名预测模型为基于命名实体识别的预测模型;
获取菜名预测模型输出的菜名预测结果;其中,所述菜名预测结果中包含有与所述待提取的菜名字段对应的至少一个候选菜品名称;
根据至少一个候选菜品名称对应的菜名指标,确定与所述待提取的菜名字段对应的菜品名称;其中,所述至少一个候选菜品名称对应的菜名指标包括:所述至少一个候选菜品名称对应的预测概率值、菜名长度、店铺数量、和/或订单数量;
其中,所述将所述待提取的菜名字段输入至预先训练得到的菜名预测模型中进一步包括:
根据分割符号对所述待提取的菜名字段进行字符串分割,获得至少一个菜名子串;
将所述至少一个菜名子串分别输入至预先训练得到的菜名预测模型中。
2.根据权利要求1所述的方法,其中,在所述将所述待提取的菜名字段输入至预先训练得到的菜名预测模型中之前,所述方法还包括:
获取菜名字段样本;
为所述菜名字段样本配置对应的标注;
将携带有标注的菜名字段样本输入至预设的菜名预测模型中,进行菜名预测模型训练。
3.根据权利要求2所述的方法,其中,所述为所述菜名字段样本配置对应的标注进一步包括:
对所述菜名字段样本进行字符串分割,获得至少一个菜名样本子串;
将所述至少一个菜名样本子串分别与预先构建的标注词库进行匹配;
根据匹配结果,为所述至少一个菜名样本子串配置对应的标注。
4.根据权利要求3所述的方法,其中,所述标注词库中包含有标准菜名词表、食材词表、口味词表、及做法词表中的至少一种。
5.根据权利要求3或4所述的方法,其中,所述将所述至少一个菜名样本子串分别与预先构建的标注词库进行匹配进一步包括:将所述至少一个菜名样本子串分别与预先构建的标注词库中的至少一个词进行最长字符串匹配。
6.根据权利要求1-4中任一项所述的方法,其中,所述菜名预测模型为基于BiLSTM+crf的命名实体识别的预测模型。
7.一种菜品名称提取装置,包括:
第一获取模块,适于获取待提取的菜名字段;
预测模块,适于将所述待提取的菜名字段输入至预先训练得到的菜名预测模型中,其中,所述菜名预测模型为基于命名实体识别的预测模型;
第二获取模块,适于获取菜名预测模型输出的菜名预测结果;其中,所述菜名预测结果中包含有与所述待提取的菜名字段对应的至少一个候选菜品名称;
确定模块,适于根据至少一个候选菜品名称对应的菜名指标,确定与所述待提取的菜名字段对应的菜品名称;其中,所述至少一个候选菜品名称对应的菜名指标包括:所述至少一个候选菜品名称对应的预测概率值、菜名长度、店铺数量、和/或订单数量;
其中,所述装置还包括:
分割模块,适于根据分割符号对所述待提取的菜名字段进行字符串分割,获得至少一个菜名子串;
所述预测模块进一步适于:将所述至少一个菜名子串分别输入至预先训练得到的菜名预测模型中。
8.根据权利要求7所述的装置,其中,所述装置还包括:
第三获取模块,适于获取菜名字段样本;
标注模块,适于为所述菜名字段样本配置对应的标注;
训练模块,适于将携带有标注的菜名字段样本输入至预设的菜名预测模型中,进行菜名预测模型训练。
9.根据权利要求8所述的装置,其中,所述标注模块进一步适于:对所述菜名字段样本进行字符串分割,获得至少一个菜名样本子串;
将所述至少一个菜名样本子串分别与预先构建的标注词库进行匹配;
根据匹配结果,为所述至少一个菜名样本子串配置对应的标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于口口相传(北京)网络技术有限公司,未经口口相传(北京)网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811259894.0/1.html,转载请声明来源钻瓜专利网。