[发明专利]一种可解释、可交互的用户画像方法及装置有效
申请号: | 202011024688.9 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112131475B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 郑驰;蔡苗;夏燕;张金凤 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/216 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 杨柳岸 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 可解释 交互 用户 画像 方法 装置 | ||
1.一种可解释、可交互的用户画像方法,其特征在于:该方法包括:
S10:按照可解释的方法构建用户画像标签;
S20:使用Hive存储用户画像标签相关数据;
S30:利用ECharts让用户画像面向用户可视化、可反馈;
S40:根据用户对用户画像的调整,反馈用户意见给系统进行优化;
S50:采用反歧视以及准确性测试,检验用户画像的性能。
2.根据权利要求1所述的一种可解释、可交互的用户画像方法,其特征在于:所述S10具体为:
确定使用的标签类别,包括统计类标签、规则类标签、挖掘类标签;
在构建用户画像时,对用户画像的标签进行自然语言解释,包括对标签类别、标签数据来源、标签推理规则进行解释;
按照解释的难度确定标签所占的比例分别为统计类标签50%、规则类标签30%、挖掘类标签20%。
3.根据权利要求2所述的一种可解释、可交互的用户画像方法,其特征在于:所述确定使用的标签类别中,挖掘类标签利用隐因子模型LFM以及TF-IDF挖掘数据,提交Spark任务进行计算。
4.根据权利要求1所述的一种可解释、可交互的用户画像方法,其特征在于:所述S20具体为:
建立Hive用户标签表,确定标签的名称、内容、解释栏;
将计算出的用户标签向量值插入Hive用户标签表“内容”中,将对标签的自然语言解释放在用户标签表中的“解释栏”。
5.根据权利要求1所述的一种可解释、可交互的用户画像方法,其特征在于:所述S30具体为:
引入ECharts文件,指定使用雷达图;
雷达图的指示器为Hive数据仓库中存储的用户标签,雷达图的数据为每个用户在对应的用户标签上所得分数;
在雷达图的轴线上设置展开字段,展开字段的关键词为“解释”,内容为对应的解释,来源于Hive用户标签表中的解释栏;
在雷达图指示器上设置点击事件,点击后出现留言表,用户可以输入对用户画像的异议与其他反馈;
反馈界面使用LinearLayout进行布局,并且指定反馈框适应屏幕。
6.根据权利要求1所述的一种可解释、可交互的用户画像方法,其特征在于:所述S40具体为:
使用python工具对用户的反馈意见进行文本分词处理;
基于TF-IDF算法对反馈意见进行主题词抽取,得出用户的反馈数据文件;
基于反馈数据,调整用户的标签向量值,更新用户画像;
基于更新后的用户画像进行推荐。
7.根据权利要求1所述的一种可解释、可交互的用户画像方法,其特征在于:所述S50具体为:
对用户画像的反歧视性、准确性、反馈机制进行测试,其中,抽取相同量的正常群体和弱势群体的样本,对比正常群体和弱势群体在暴力指数标签、信用指数和犯罪可能性指数的敏感标签的平均指数差异,测试用户画像的对弱势群体的反歧视性;
使用交叉验证测试统计类标签以及规则类标签的准确性,使用抽样验证测试开发挖掘类标签的准确性;
分类用户的反馈内容,对每一类别都抽取一定反馈用户的样本,将每类分为A、B两组,A组为用户反馈之前的活跃度,B组为用户反馈之后的活跃度,将A、B两组进行对比,测试反馈机制运行效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011024688.9/1.html,转载请声明来源钻瓜专利网。