[发明专利]一种智能用户标签确定方法、终端设备及存储介质有效
申请号: | 202011590641.9 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112633394B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 林淑强;陈晨林;陈子沣;张永光;魏炜途;朱聚江 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/764;G06V10/80;G06V10/82;G06N3/04;G06N3/08;G06N20/00;G10L15/26 |
代理公司: | 厦门市精诚新创知识产权代理有限公司 35218 | 代理人: | 蔡金塔 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 用户 标签 确定 方法 终端设备 存储 介质 | ||
1.一种智能用户标签确定方法,其特征在于,包括以下步骤:
根据确定用户标签所需的数据来源将用户标签分成简单标签和复杂标签,其中,简单标签只需要结构化数据,复杂标签信息同时存在多模态数据中;
简单标签采用单一模态标签确定方法来确定,以及复杂标签采用深度学习算法确定方法来确定;
其中,复杂标签采用深度学习算法确定方法来确定的具体过程是,首先通过深度学习算法分别从所述多模态数据中提取标签特征信息,利用分类器确定标签,然后对从所述多模态数据确定的标签进行合并融合,从而确定用户标签,其中,所述多模态数据包括文本、图片、视频和语音数据;
其中,所述的对从所述多模态数据确定的标签进行合并融合,从而确定用户标签的具体过程为:
统计各模态数据的各类标签个数,用cntlabel-i-img、cntlabel-i-video、cntlabel-i-text、cntlabel-i-voice表示标签i在图片、视频、文本和语音上的个数;
把不同模态的相同标签个数加起来,cntlabel-i=cntlabel-i-img+cntlabel-i-video+cntlabel-i-text+cntlabel-i-voice,如果cntlabel-i≥cntlabel-i-ε,则确定标签i为该用户的标签,其中,cntlabel-i-ε是用来确定用户标签设定的标签个数阈值。
2.如权利要求1所述的方法,其特征在于,对于图片数据,其标签确定方法具体如下:
采用的深度神经网络算法包括依次连接的M层卷积层、池化层、全连接层和softmax层;
将图片imgsrc进行预处理得到N*N尺寸大小的图像imgt1;
imgt1输入到M层卷积层和池化层,输出标签特征向量特征向量为一个1×d的矩阵,l表示神经网络第l层;
全连接层,即标签分类器,每个全连接层的权重参数为d×n矩阵,其中,n表示标签类别个数,全连接层的具体权重参数为偏置参数为将依次输入到标签分类器,得到标签分类结果:
把Rl+1通过softmax层,将每个用户标签的分类结果映射到(0,1)概率区间,其中,softmax层函数为:其中,Pi表示该图片属于标签类别i的概率;
设定标签确定阈值ε,如果Pi-max≥ε,则该图片标签类别为i,其中,Pi-max表示最大Pi。
3.如权利要求2所述的方法,其特征在于,对于视频数据,其标签确定方法具体如下:
对视频数据按设定抽样频率抽取图片;
按照图片数据的标签确定方法确定图片的标签类别;
统计每个标签类别的图片数,按预定策略设置阈值N,即一个视频中,如果标签类别i的图片数≥N,则该视频标签类别为i。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011590641.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三维钢瓶打字装置
- 下一篇:一种履带式两栖泵车