[发明专利]一种基于用户画像聚类的用户类型自动化标注系统有效

专利信息
申请号: 201910232018.7 申请日: 2019-03-26
公开(公告)号: CN110020201B 公开(公告)日: 2021-05-25
发明(设计)人: 白琳;蔡承烨;李国斌;周新运;吴怀林;王建飞;赵敏 申请(专利权)人: 中国科学院软件研究所;北京奥鹏远程教育中心有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06K9/62;G06Q30/02
代理公司: 北京科迪生专利代理有限责任公司 11251 代理人: 安丽
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于用户画像聚类的用户类型自动化标注系统,包括用户画像数据采集模块、用户画像特征处理模块、用户画像聚类模块和用户类型标注模块;通过运行四个系统模块,该系统能为用户自动化的标出其所属的类型,并支持以配置文件的形式对需要标注的类型进行更新,极大的简化了用户类型标注的流程。在实际应用中,每个周期系统都会自动运行,并对全平台的用户进行自动化标注。其标注结果可应用于用户管理、数据挖掘、数据展示等相关工作,对平台的管理者与用户都具有积极的意义。
搜索关键词: 一种 基于 用户 画像 类型 自动化 标注 系统
【主权项】:
1.一种基于用户画像聚类的用户类型自动化标注系统,其特征在于:包括,用户画像数据采集模块、用户画像特征处理模块、用户画像聚类模块和用户类型标注模块;用户画像数据采集模块:根据配置文件的信息,从平台数据库中读取原始数据,并对原始数据进行用户画像维度标注以及用户画像维度特征计算,最终生成用户画像数据,用户画像数据将会输入到用户画像特征处理模块中;用户画像特征处理模块:以用户画像数据为输入,为用户画像数据进行维度划分,然后分别针对每个维度进行特征清洗并修正异常数据,修正后的数据经过特征归一化以及特征组合后生成当前维度的特征值,最后将各维度的特征组合生成用户画像特征向量;用户画像聚类模块:读取用户画像特征处理模块生成的用户画像特征向量,根据配置文件的信息初始化聚类模型,然后初始化各个类别的聚类中心,通过对损失函数的最小化操作,不断计算并更新各个类别的聚类中心,达到指定的循环次数或目标函数最小化到指定值之后,输出各个类别的聚类中心结果数据以及每一个用户的聚类结果数据;用户类型标注模块:获取聚类中心结果数据,将聚类中心结果数据进行中心值归一化,并组织成聚类中心集合池,然后从配置文件中按照格式解析出用户类型‑匹配规则优先级队列,并从该队列中优先级最高的用户类型开始,在聚类中心集合池中进行用户类型匹配,若匹配成功则为用户画像聚类结果中属于标签值属于当前聚类中心的用户标注该用户类型,直至中心集合池为空或优先级队列为空,最终产生用户类型标注结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所;北京奥鹏远程教育中心有限公司,未经中国科学院软件研究所;北京奥鹏远程教育中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910232018.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top