[发明专利]物品属性值的确定方法和装置在审
申请号: | 202110608525.3 | 申请日: | 2021-06-01 |
公开(公告)号: | CN113360724A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 王奕磊;王刚;佘志东 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F40/258;G06K9/62;G06N20/00 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 宗磊;杨倩 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物品 属性 确定 方法 装置 | ||
1.一种物品属性值的确定方法,其特征在于,包括:
获取目标物品的物品类目、物品属性名及物品标题;
将所述物品类目、所述物品属性名及所述物品标题,输入属性抽取模型中,得到所述目标物品的物品属性值,所述物品属性值与所述物品属性名相对应;其中,所述属性抽取模型包括输入层、编码层及输出层,所述输入层的输入参数为所述物品类目、所述物品属性名及所述物品标题拼接的字符串,所述编码层用于将所述字符串编码为多个词向量,所述输出层基于所述多个词向量,确定所述物品属性名在所述物品标题中的标注信息。
2.根据权利要求1所述的方法,其特征在于,所述输入所述属性抽取模型中,得到所述目标物品的物品属性值之前,还包括:
获取多个样本的样本信息,所述样本信息包括:样本类目、样本标题、样本属性名及其对应的样本属性值;
根据所述样本信息,生成样本数据;
利用多个所述样本数据,训练机器学习模型,生成所述属性抽取模型。
3.根据权利要求2所述的方法,其特征在于,所述根据多个样本信息,生成样本数据,包括:
获取当前样本的样本信息;
根据所述当前样本的样本属性值,对所述当前样本的样本标题进行标注处理;
生成所述当前样本的样本数据,所述样本数据中包括:样本类目、标注处理后的样本标题及样本属性名。
4.根据权利要求3所述的方法,其特征在于,所述根据所述当前样本的样本属性值,对所述当前样本的样本标题进行标注处理,包括:
对所述当前样本的样本标题进行标题预处理;
对所述当前样本的样本属性值进行属性预处理;
在处理后的样本标题中,匹配出处理后的样本属性值,得到所述当前样本的样本属性名对应的标注信息,所述标注信息包括:起始位置及结束位置。
5.根据权利要求3所述的方法,其特征在于,所述根据所述当前样本的样本属性值,对所述当前样本的样本标题进行标注处理,包括:
根据所述当前样本的样本属性值,按预设标注策略,对所述当前样本的样本标题进行标注处理,所述预设标注策略包括以下至少之一:规格属性硬匹配策略、最大子串匹配策略、正则表达式策略及软匹配策略。
6.根据权利要求2所述的方法,其特征在于,所述根据多个样本信息,生成样本数据,包括:
根据所述样本信息,构造正样本数据和负样本数据,所述正样本数据为物品标题中包含物品属性名对应的属性值的样本数据,所述负样本数据为物品标题中不包含物品属性名对应的属性值的样本数据;
所述利用多个所述样本数据,训练机器学习模型,生成属性抽取模型,包括:
利用多个所述正样本数据和多个所述负样本数据,训练所述机器学习模型,生成所述属性抽取模型。
7.根据权利要求1所述的方法,其特征在于,所述机器学习模型为基于MRC模型及指针网络模型构造的模型。
8.一种物品属性值的确定装置,其特征在于,包括:
信息获取模块,用于获取目标物品的物品类目、物品属性名及物品标题;
属性值确定模块,将所述物品类目、所述物品属性名及所述物品标题,输入属性抽取模型中,得到所述目标物品的物品属性值,所述物品属性值与所述物品属性名相对应;其中,所述属性抽取模型包括输入层、编码层及输出层,所述输入层的输入参数为所述物品类目、所述物品属性名及所述物品标题拼接的字符串,所述编码层用于将所述字符串编码为多个词向量,所述输出层基于所述多个词向量,确定所述物品属性名在所述物品标题中的标注信息。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110608525.3/1.html,转载请声明来源钻瓜专利网。