[发明专利]年龄标注方法及系统在审
申请号: | 201911031020.4 | 申请日: | 2019-10-28 |
公开(公告)号: | CN110781436A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 唐亮;曹特磊 | 申请(专利权)人: | 时趣互动(北京)科技有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958 |
代理公司: | 11471 北京细软智谷知识产权代理有限责任公司 | 代理人: | 涂凤琴 |
地址: | 100020 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 数据获取 置信度 申请 工作量 | ||
本申请涉及一种年龄标注方法及系统,年龄标注方法包括识别特征用户;对特征用户进行年龄标注;根据特征用户的年龄标注对未标注年龄的用户进行年龄标注。本申请可以大幅减少数据获取工作量,并且根据特征用户的年龄标注对未标注年龄的用户进行年龄标注,可以提升年龄标注结果的置信度。
技术领域
本申请涉及互联网技术领域,尤其是一种年龄标注方法及系统。
背景技术
随着网络的迅猛发展,人们已经进入了信息和网络经济时代,这对企业的发展和个人生活都产生了极大影响。为了提高服务质量,很多网站或媒体都需要对用户身份进行识别,依据群体的特性提供有针对性的服务。因此,年龄作为用户身份中的重要因素为提供有针对性的服务提供重要依据,如何识别和标注用户年龄对提高网络服务质量至关重要。
相关技术中,通过在互联网社交媒体平台中,根据收集到的用户的历史行为特征如历史发文、评价、关注等进行年龄推断以实现对未知年龄的用户进行年龄标注。然而一般成熟的互联网社交媒体平台动辄就会有上亿的用户规模,收集全部用户的历史行为数据非常困难,历史行为数据缺失或不足严重影响了平台年龄标注结果。
发明内容
为至少在一定程度上克服相关技术中,通过在互联网社交媒体平台中,根据收集到的用户的历史行为特征如历史发文、评价、关注等进行年龄推断以为实现对未知年龄的用户进行年龄标注,然而一般成熟的互联网社交媒体平台动辄就会有上亿的用户规模,收集全部用户的历史行为数据非常困难,历史行为数据缺失或不足严重影响了平台年龄标注结果的问题,本申请提供一种年龄标注方法及系统。
第一方面,本申请提供一种年龄标注方法,包括:
识别特征用户;
对所述特征用户进行年龄标注;
根据特征用户的年龄标注对未标注年龄的用户进行年龄标注。
进一步的,所述识别特征用户包括:
获取用户信息;
根据所述用户信息对所述用户的特征数据进行判断;
若所述用户的特征数据大于预设阈值,则识别为所述特征用户。
进一步的,所述特征数据包括:粉丝量、关注量和互动量中的一种或多种。
进一步的,所述识别特征用户还包括:
若所述用户的特征数据小于或等于预设阈值,则识别为普通用户。
进一步的,所述对所述特征用户进行年龄标注包括:
根据已知用户的年龄对所述特征用户进行年龄标注。
进一步的,所述根据已知用户的年龄对所述特征用户进行年龄标注包括:
获取与所述已知年龄的用户进行关注和/或互动的特征用户;
根据所述已知年龄的用户的年龄对所述特征用户进行年龄标注。
进一步的,所述根据特征用户的年龄标注对未标注年龄的用户进行年龄标注包括:
建立特征用户数据库;
遍历所述特征用户数据库中的特征用户,获取与所述特征用户有关注和/或互动行为的用户;
根据特征用户的年龄标注对与所述特征用户有关注和/或互动行为的未标注年龄的用户进行年龄标注。
第二方面,本申请提供一种年龄标注系统,包括:
识别模块,用于识别特征用户;
第一标注模块,用于对所述特征用户进行年龄标注;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于时趣互动(北京)科技有限公司,未经时趣互动(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911031020.4/2.html,转载请声明来源钻瓜专利网。