[发明专利]基于电子商务的数据处理方法与装置有效
申请号: | 201710536624.9 | 申请日: | 2017-07-04 |
公开(公告)号: | CN107315823B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 陈贱辉;邵荣防;郝晖;史亚妮;谢文晶 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 阚梓瑄;王卫忠 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 电子商务 数据处理 方法 装置 | ||
本公开提供一种基于电子商务的数据处理方法与装置。数据处理方法包括:获取数据,所述数据包括用户搜索日志和物流信息;根据所述数据获取基于地域的关键词权重值降序排名;根据所述基于地域的关键词权重值降序排名获取关键词在各地域的特征值;根据所述特征值标注关键词对应的热点地域。本公开提供的基于电子商务的数据处理方法能够挖掘出关键词的地域特征。
技术领域
本公开涉及数据挖掘技术领域,具体而言,涉及一种基于电子商务的数据处理方法与装置。
背景技术
随着电商业务的发展,传统的“千人一面”搜索推荐系统已不能有效的满足用户需求,且我国幅员辽阔,各地域在气候、习俗、环境等方面存在较大的差异。
目前电商的搜索系统主要根据商品与用户搜索关键词的文本相关性、商品本身信息质量等维度对商品进行展示排序,不涉及地域特征;商品推荐系统则主要依据用户过往行为、平台促销活动、人工运营等方式确定推荐商品,也没有将地域特征纳入推荐因子。因此,在现有的数据处理模式下,往往存在着搜索结果不能精准的贴近用户需求等问题。例如北方空调大部分需冷暖模式,而在华南地区大部分只需制冷模式,当华南地区的用户搜索空调时很难获取到精准贴合需求的搜索结果。此外,不纳入地域特征的推荐,也会导致流量转换损失,甚至引起用户反感,例如某个时期防雾霾口罩在北方热销,但推荐系统却将该类产品推荐给海南等地的用户。最后,在地方性传统节假日期间,地方特产、服饰等具有区域性的高销量,不纳入地域特征的搜索推荐系统对此“无能为力”。
因此,需要一种能够对商品的地域特征进行挖掘的数据处理方法。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种基于电子商务的数据处理方法与装置,用于从用户的搜索行为日志以及商品的物流信息中,通过对数据进行清理、集成、计算等处理,输出关键词的地域特征画像,给搜索、推荐、广告系统提供基础数据支撑。
根据本公开实施例的第一方面,提供一种基于电子商务的数据处理方法,包括:获取数据,数据包括用户搜索日志和物流信息;根据数据获取基于地域的关键词权重值降序排名;根据基于地域的关键词权重值降序排名获取关键词在各地域的特征值;根据特征值标注关键词对应的热点地域。
在本公开的一种示例性实施例中,获取基于地域的关键词权重值降序排名包括:根据搜索日志获取基于地域的关键词搜索页面浏览量;根据物流信息获取基于地域的关键词商品数;基于地域将关键词搜索页面浏览量与第一系数的乘积和关键词商品数与第二系数的乘积相加作为关键词在地域的权重值;去除权重值低于阈值的关键词,基于地域对关键词按权重值进行降序排名。
在本公开的一种示例性实施例中,根据基于地域的关键词权重值降序排名获取关键词在各地域的特征值包括:获取地域的总权重值降序排名;获取基于全部地域的关键词权重值降序排名;对于各地域,获取权重值既在地域排名前N又在全部地域排名前xN的关键词,N为自然数,x为扩展系数;基于每一关键词以及每一地域计算特征值:(一地域的一关键词的权重值/地域的总权重值)*(总地域数/关键词在地域排名前N的地域数)。
在本公开的一种示例性实施例中,标注关键词对应的热点地域包括:获取一关键词在各地域的特征值的方差;去除方差小于阈值的地域,获取剩余地域的方差降序排名;根据方差降序排名标注关键词对应的热点地域。
在本公开的一种示例性实施例中,获取数据包括去除数据中的爬虫数据、黑名单用户数据、黑名单IP数据、无法判断来源的数据以及长尾关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710536624.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种知识点关联的挖掘方法
- 下一篇:用于生成热力图的方法和装置