[发明专利]预测用户婚姻状态的方法和装置在审
申请号: | 201510715619.5 | 申请日: | 2015-10-29 |
公开(公告)号: | CN106651409A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 邵佳帅;陈海勇 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 中原信达知识产权代理有限责任公司11219 | 代理人: | 张一军,姜劲 |
地址: | 100080 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 用户 婚姻 状态 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,特别地涉及一种预测用户婚姻状态的方法和装置。
背景技术
电商行业飞速发展,用户希望在电商购物过程中获得个性化的推荐信息。个性化的购物推荐系统的背后需要大量的用户标签来支撑,其中“已婚/未婚”这个婚姻状态标签是非常重要的。然而,电子商务网站上的用户填写个人信息的比例非常低(平均不到5%),因此目前的购物推荐系统难以判断婚姻状态,从而无法向用户提供合理的推荐商品。
发明内容
有鉴于此,本发明提供一种预测用户婚姻状态的方法和装置,能够准确有效地预测用户的婚姻状态。
为实现上述目的,根据本发明的一个方面,提供了一种预测用户婚姻状态的方法。
本发明的预测用户婚姻状态的方法包括:获取样本用户的婚姻状态信息、购物评价信息以及订单总数量;根据所述样本用户的婚姻状态信息、购物评价信息以及订单总数量编写训练数据向量;根据所述训练数据向量进行分类训练,得到预测模型;利用所述预测模型预测目标用户的婚姻状态信息。
可选地,所述婚姻状态包括未婚状态和已婚状态,所述根据所述 样本用户的婚姻状态信息、购物评价信息以及订单总数量编写训练数据向量的步骤包括:将所述样本用户的所述婚姻状态信息进行二值化处理,得到二值化结果;统计购物评价信息中已婚特征词语出现次数以及未婚特征词语出现次数;将所述二值化结果、已婚特征词语出现次数、未婚特征词语出现次数以及订单总数量作为向量的维度,编写所述训练数据向量。
可选地,还包括:在所述根据所述样本用户的婚姻状态信息、购物评价信息以及订单总数量编写训练数据向量的步骤之前,获取所述样本用户的预设类型订单的数量;在所述根据所述样本用户的婚姻状态信息、购物评价信息以及订单总数量编写训练数据向量的步骤的同时,将所述预设类型订单的数量作为向量维度编写所述训练数据向量。
可选地,所述预设类型订单包括下列选项之一或下列选项中多者的组合:母婴类型订单、家电类型订单、家居类型订单,以及保健类型订单。
可选地,利用adaboost算法模型根据训练数据向量进行分类训练。
根据本发明的另一方面,提供了一种预测用户婚姻状态的装置。
本发明的预测用户婚姻状态的装置,包括:获取模块,用于获取样本用户的婚姻状态信息、购物评价信息以及订单总数量;编写模块,用于根据所述样本用户的婚姻状态信息、购物评价信息以及订单总数量编写训练数据向量;建模模块,用于根据所述训练数据向量进行分类训练,得到预测模型;预测模块,用于将目标用户的购物评价信息和订单分类统计信息输入所述预测模型,得到该目标用户的婚姻状态信息。
可选地,所述婚姻状态包括未婚状态和已婚状态,所述编写模块 还用于:将所述样本用户的所述婚姻状态信息进行二值化处理,得到二值化结果;统计购物评价信息中已婚特征词语出现次数以及未婚特征词语出现次数;将所述二值化结果、已婚特征词语出现次数、未婚特征词语出现次数以及订单总数量作为向量的维度,编写所述训练数据向量。
可选地,所述获取模块还用于获取所述样本用户的预设类型订单的数量;所述编写模块还用于将所述预设类型订单的数量作为向量维度编写所述训练数据向量。
可选地,在所述获取模块中,所述预设类型订单包括下列选项之一或下列选项中多者的组合:母婴类型订单、家电类型订单、家居类型订单,以及保健类型订单。
可选地,在所述建模模块中,利用adaboost算法模型根据训练数据向量进行分类训练。
根据本发明的技术方案以用户购物评价以及订单总数量为特征信息,基于机器学习得到了预测模型,然后应用该预测模型去判断目标用户的婚姻状态,具有简单易行、准确度高等优点。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施方式的预测用户婚姻状态的方法的主要步骤的示意图;
图2是根据本发明实施方式的预测用户婚姻状态的装置的主要模块的示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发 明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510715619.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据分析方法及装置
- 下一篇:一种应用管理方法及装置