[发明专利]用户画像构建方法、装置、计算机设备和存储介质有效
申请号: | 201911101736.7 | 申请日: | 2019-11-12 |
公开(公告)号: | CN111050193B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 林田谦谨 | 申请(专利权)人: | 汉口北进出口服务有限公司 |
主分类号: | H04N21/25 | 分类号: | H04N21/25;H04N21/258;H04N21/45;H04N21/466;H04N21/475;H04N21/4788;H04N21/488 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 刘羚 |
地址: | 430312 湖北省武汉市黄*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 画像 构建 方法 装置 计算机 设备 存储 介质 | ||
1.一种用户画像构建方法,所述方法包括:
获取视频播放时发送的弹幕数据、并记录弹幕发送时间;
根据预设弹幕情感分析模型对所述弹幕数据进行情感分析,得到所述弹幕数据对应的情感标签;
采集所述弹幕发送时间前后预设时间范围内的画面信息,根据预设画面内容识别模型,获取所述画面信息对应的画面内容;
根据所述情感标签以及所述画面内容,构建用户画像;
所述根据所述情感标签以及所述画面内容,构建用户画像包括:根据所述情感标签和所述画面内容,分析用户感兴趣的内容、不感兴趣的内容以及讨厌的内容,根据分析得到的信息构建用户画像;
所述根据预设弹幕情感分析模型对所述弹幕数据进行情感分析,得到所述弹幕数据对应的情感标签之前,还包括:
获取历史弹幕数据以及所述历史弹幕数据对应标注的情感值,所述情感值采用小样本结合机器学习方式标注;
根据所述历史弹幕数据,得到多个弹幕词语;
获取各弹幕词语对应的情感值平均值,根据所述多个弹幕词语以及对应的所述情感值平均值,生成弹幕情感训练数据;
将所述弹幕情感训练数据输入至基于循环递归神经网络的模型,训练得到预设弹幕情感分析模型。
2.根据权利要求1所述的方法,其特征在于,所述采集所述弹幕发送时间前后预设时间范围内的画面信息,根据预设画面内容识别模型,获取所述画面信息对应的画面内容之前,还包括:
获取样本视频画面信息以及对应的文本描述;
根据所述样本视频画面信息以及所述对应的文本描述训练GAN模型,得到预设画面内容识别模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述样本视频画面信息以及所述对应的文本描述训练GAN模型,得到预设画面内容识别模型包括:
连续或周期性抽取所述样本视频画面信息中视频帧;
将抽取的视频帧作为GAN模型输入,并将所述对应的文本描述作为GAN模型输出,训练GAN模型,得到预设画面内容识别模型。
4.根据权利要求3所述的方法,其特征在于,所述将抽取的视频帧作为GAN模型输入,并将所述对应的文本描述作为GAN模型输出,训练GAN模型,得到预设画面内容识别模型包括:
获取抽取的视频帧,解析所述抽取的视频帧对应高度、宽度以及通道的维度数据;
将所述抽取的视频帧以及对应的所述维度数据送入神经网络模型中编码器进行编码,得到编码数据;
将所述编码数据导入与所述编码器对应的解码器,解码输出文本描述;
根据解码输出的文本描述以及所述对应的文本描述调整神经网络模型中分类器,得到预设画面内容识别模型。
5.根据权利要求1所述的方法,其特征在于,所述根据所述情感标签以及所述画面内容,构建用户画像之后,还包括:
根据构建的用户画像,推荐视频至用户。
6.根据权利要求5所述的方法,其特征在于,所述根据构建的用户画像,推荐视频至用户之后,还包括:
采集用户对已推荐视频的操作行为数据,操作行为包括点击观看、收藏、评论以及发送弹幕;
根据所述操作行为数据,优化所述用户画像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉口北进出口服务有限公司,未经汉口北进出口服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911101736.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种调节方便的单杠
- 下一篇:一种基于区块链的分布式共享充电桩交易系统和方法