[发明专利]一种确定用户身份类别的方法及装置有效
申请号: | 201610388620.6 | 申请日: | 2016-06-02 |
公开(公告)号: | CN106878242B | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 李辉;梅炜;操颖平;林嘉南 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F21/31;G06F40/117 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 黄熊 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 用户 身份 类别 方法 装置 | ||
本申请公开了确定用户身份类别的方法,包括:接收用户的数据信息,数据信息包括多个含有用户身份信息的标记文本;将多个标记文本与关键词词库中的属性关键词进行匹配;其中,关键词词库中包括至少一个属性关键词及与属性关键词对应的类别;统计标记文本与类别相对应的对应次数;其中,类别对应与标记文本相匹配的属性关键词;依据用户的标记文本与类别的对应次数,确定用户身份类别。本申请还公开了确定用户身份类别的装置,包括:接收模块、匹配模块、统计模块、身份类别确定模块。数据信息中还可包括认证信息、注册信息和/或业务信息。这就实现了对用户相关的数据信息进行主动收集和分析处理,从而确定用户身份类别。
技术领域
本申请涉及计算机信息技术领域,尤其涉及一种确定用户身份类别的方法及装置。
背景技术
许多服务提供商的业务的开展依赖于对客户资料的收集。服务提供商收集到上述客户的资料后,会依据客户提供的信息为客户提供服务。
现有技术中对客户资料的收集和处理,往往由客户直接向服务提供商提供所需资料,提出服务需求,服务提供商依据客户提供的资料为客户提供服务。但这种方式的缺陷在于:资料的收集完全依赖于客户主动,服务提供商只能被动接收,因此,服务提供商无法主动及时寻找到潜在客户,并且由于客户提供资料的局限性,也难以对客户提供的资料进行统计分析。
而与此同时,随着互联网的广泛应用,用户在使用互联网的过程中,在互联网上存储了大量带有用户信息的数据。如何利用用户留存在互联网上的数据对用户进行分析处理,确定用户的类别,例如用户的社会身份类别,从而寻找到潜在用户,成为了亟待解决的问题。
发明内容
本申请实施例提供了一种确定用户身份类别的方法和装置,旨在对用户相关的数据信息进行主动收集和分析处理,从而确定用户身份类别。
为实现上述目的,本申请实施例提供了一种确定用户身份类别的方法,其特征在于,所述方法包括:
接收用户的数据信息,所述数据信息包括多个含有用户身份信息的标记文本;
将多个所述标记文本与关键词词库中的属性关键词进行匹配;其中,所述关键词词库中包括至少一个属性关键词及与属性关键词对应的类别;
统计所述标记文本与类别相对应的对应次数;其中,所述类别对应与所述标记文本相匹配的属性关键词;
依据用户的所述标记文本与所述类别的对应次数,确定用户身份类别。
作为优选,本申请实施例中,在接收用户的数据信息之后,在将多个所述标记文本与关键词词库中的属性关键词进行匹配之前,还包括:对所述标记文本进行分词,将所述标记文本切分成至少一个切分词;
将多个所述标记文本与关键词词库中的属性关键词进行匹配,包括:
将所述标记文本中的所述切分词分别与所述属性关键词进行匹配。
作为优选,本申请实施例中,统计所述标记文本与类别相对应的对应次数,包括:
若所述切分词与所述属性关键词匹配,则将所述属性关键词所对应的类别与包含所述切分词的标记文本相对应的对应次数增加一个步长单位或者计为一个步长单位;
将相同的类别与用户的各标记文本相对应的对应次数进行累加,确定用户的标记文本与各类别相对应的对应次数。
作为优选,本申请实施例中,所述数据信息还包括用户的认证信息;
依据用户的所述标记文本与所述类别的对应次数,确定用户身份类别,包括:
对于有认证信息的已认证用户,将与该用户的认证信息一致的类别作为已认证类别;将所述已认证类别对应的类别,确定为有认证信息的已认证用户的身份类别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610388620.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:降低蓝牙耳机功耗的方法
- 下一篇:耳机线套装收纳棒