[发明专利]信息识别方法和装置在审
申请号: | 201810550227.1 | 申请日: | 2018-05-31 |
公开(公告)号: | CN110555451A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 崔同;赫南;胡景贺 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 11204 北京英赛嘉华知识产权代理有限责任公司 | 代理人: | 王达佐;马晓亚 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 设备标识 用户属性 用户行为信息 归属 关联 预设 用户属性信息 方法和装置 特征提取 特征信息 同一用户 信息识别 用户账号 概率 申请 | ||
本申请实施例公开了信息识别方法和装置。该方法的一具体实施方式包括:获取与待处理用户账号相关联的信息,该信息包括至少一个设备标识和与每个设备标识对应的用户行为信息;对每个设备标识所对应的用户行为信息进行特征提取,将提取出的特征信息输入预先训练的与指定用户属性相关联的识别模型,得到识别结果,该识别结果包括该设备标识所指示的设备所归属的用户的指定用户属性的属性值为预设属性值的概率;基于所得的识别结果中的概率,确定至少一个设备标识分别指示的设备所归属的用户的指定用户属性的属性值是否为预设属性值。该实施方式实现了针对关联有同一用户账号的不同设备标识分别指示的设备所归属的用户的指定用户属性信息的识别。
技术领域
本申请实施例涉及计算机技术领域,具体涉及信息识别方法和装置。
背景技术
在互联网中,用户通过注册可以获得对应的用户账号。对于某些用户账号,该用户账号所关联的用户信息中可能缺失某些用户属性信息,例如性别、年龄、职业等。
现有的用于识别用户的属性信息的方法,通常是基于用户账号所归属的用户的语音信息或视频信息来识别该用户的性别和/或年龄等。但同一用户账号可能登录在不同的用户设备上,而该不同的用户设备可能归属于不同的用户,因此同一用户账号在不同的用户设备上可能对应不同的购物习惯和购物偏好等。也因此,采用现有的用于识别用户的属性信息的方法所识别出的用户的属性信息通常准确率较低。
发明内容
本申请实施例提出了信息识别方法和装置。
第一方面,本申请实施例提供了一种信息识别方法,该方法包括:获取与待处理用户账号相关联的信息,其中,上述信息包括至少一个设备标识和上述至少一个设备标识分别对应的用户行为信息;对每个设备标识所对应的用户行为信息进行特征提取,将提取出的特征信息输入预先训练的与指定用户属性相关联的识别模型,得到与该设备标识对应的识别结果,其中,上述识别结果包括该设备标识所指示的设备所归属的用户的上述指定用户属性的属性值为预设属性值的概率;基于所得的识别结果中的概率,确定上述至少一个设备标识分别指示的设备所归属的用户的上述指定用户属性的属性值是否为上述预设属性值。
在一些实施例中,上述方法还包括:生成与上述至少一个设备标识中的设备标识对应的标签信息,其中,上述标签信息用于指示所对应的设备标识所指示的设备所归属的用户的上述指定用户属性的属性值是否为上述预设属性值。
在一些实施例中,上述基于所得的识别结果中的概率,确定上述至少一个设备标识分别指示的设备所归属的用户的上述指定用户属性的属性值是否为上述预设属性值,包括:对于上述至少一个设备标识中的每个设备标识,确定该设备标识所对应的识别结果中的概率是否小于概率阈值,若否,则确定该设备标识所指示的设备所归属的用户的上述指定用户属性的属性值为上述预设属性值。
在一些实施例中,上述基于所得的识别结果中的概率,确定上述至少一个设备标识分别指示的设备所归属的用户的上述指定用户属性的属性值是否为上述预设属性值,还包括:将所得的各个识别结果中的概率按数值由大到小的顺序进行排序;从经排序后的概率中的最大值一侧开始,选取出前预置数目个不小于概率阈值的概率,将选取出的概率所在的识别结果所对应的设备标识所指示的设备所归属的用户的上述指定用户属性的属性值确定为上述预设属性值。
在一些实施例中,用户行为信息包括以下至少一项:浏览信息、下单信息,上述浏览信息和上述下单信息分别包括信息序列组,信息序列中的信息为以下中的一项:物品标识、品类标识、品牌标识、店铺标识。
在一些实施例中,上述对每个设备标识所对应的用户行为信息进行特征提取,包括:对于每个设备标识所对应的用户行为信息中的每个信息序列,将该信息序列中的各条信息分别映射为具有指定维度的向量,确定经映射所得的各个向量的平均值,将上述平均值作为提取出的特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810550227.1/2.html,转载请声明来源钻瓜专利网。