[发明专利]一种提取在线商品重量信息的方法和系统在审
申请号: | 201910151771.3 | 申请日: | 2019-02-28 |
公开(公告)号: | CN109960797A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 张瑞;张彪 | 申请(专利权)人: | 上海浪潮云计算服务有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/951;G06Q30/02 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 陈婷婷 |
地址: | 200436 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 重量信息 在线商品 商品基本信息 短句 网络零售 重量单位 分析处理技术 数据处理模块 数据提取模块 预处理模块 单位价格 基本信息 商品信息 商品营销 市场价格 政府部门 重量数据 大数据 评估 统一 | ||
1.一种提取在线商品重量信息的方法,其特征在于该方法获取商品的基本信息,通过函数将商品基本信息分离并提取与商品重量相关的短句;提取短句中与重量相关的元素;统一重量单位,得到同一重量单位下的数值,既商品的重量信息。
2.根据权利要求1所述的一种提取在线商品重量信息的方法,其特征在于所述与重量相关的短句为包含重量关键词的短句,与重量相关的元素包含重量数据和重量单位,该方法的具体实现方式如下:
1)、预处理,根据商品信息特点分离商品基本信息,得到包含重量关键词的短句,并去除所述重量关键词与重量数据间的干扰符号;
2)、提取重量数据和重量单位,若所述短句中有表示重量数据范围的连接符号,则利用连接符号在短句中的位置得到重量数值的最小值和最大值;
3)、统一重量单位,提取步骤2)所得字符串中的数值部分并将之转换成在同一重量单位下的数值。
3.根据权利要求2所述的一种提取在线商品重量信息的方法,其特征在于用SPLIT函数实现对商品基本信息的分隔,用FILTER函数提取分隔后包含重量关键词的短句。
4.根据权利要求3所述的一种提取在线商品重量信息的方法,其特征在于用REPLACE函数去除干扰符号。
5.根据权利要求2或3或4所述的一种提取在线商品重量信息的方法,其特征在于所述预处理得到的短句包含两种模式:
[模式1:]*+重量关键词+数值[[+单位]+连接符+数值]+单位+*
[模式2:]*+重量关键词+(+单位+)+数值+*
其中,*代表0个或多个任意字符,+连接语句各组分,[]代表可能存在也可能不存在的语句组分。
6.根据权利要求5所述的一种提取在线商品重量信息的方法,其特征在于,提取重量数据和重量单位时,用函数LEN获得字符串长度;用INSTR函数获取位置,得到重量关键词和重量单位的起始位置;用MID函数得到提取结果。
7.根据权利要求6所述的一种提取在线商品重量信息的方法,其特征在于对于模式1,通过重量关键词和重量单位的起始位置以及字符串长度,得到待提取的重量数字和重量单位的起始位置,进而得到待提取的重量数字和重量单位的总长度。
8.根据权利要求7所述的一种提取在线商品重量信息的方法,其特征在于若记上述步骤2)所得字符串结果为NumUnit,提取NumUnit的数字部分记为Num,最终结果为w,则商品的实际重量为:
w=Val(Num)×Coefficient(uj)
Coefficient(uj)代表该数字对应的重量单位相对于设定重量单位的转换系数;Val函数将非数值格式的数字转换成数值格式的数字。
9.根据权利要求8所述的一种提取在线商品重量信息的方法,其特征在于在进行上述数据处理过程中,先执行设计单位kg的处理,再执行余下的含单位g的处理。
10.一种提取在线商品重量信息的系统,其特征在于包括商品信息预处理模块、数据提取模块和数据处理模块,
商品信息预处理模块用于根据商品信息特点分离商品基本信息,得到包含重量关键词的短句,并去除所述重量关键词与重量数据间的干扰符号;
数据提取模块用于提取所述短句中的重量数据和重量单位;
数据处理模块用于根据提取的重量数据和重量单位计算出统一单位的商品重量信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海浪潮云计算服务有限公司,未经上海浪潮云计算服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910151771.3/1.html,转载请声明来源钻瓜专利网。