[发明专利]互联网用户的知识与兴趣个性化描摹系统在审
申请号: | 202011641277.4 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112733021A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 刘文平;王辉 | 申请(专利权)人: | 荆门汇易佳信息科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/289;G06N20/00;G06Q30/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 448000 湖北省荆门市*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 互联网 用户 知识 兴趣 个性化 描摹 系统 | ||
1.互联网用户的知识与兴趣个性化描摹系统,其特征在于,通过网络用户的个人已有知识体系的解析获取用户特征,基于对互联网用户数据的解析,提出一种基于LDA改进模型的互联网用户知识与兴趣描摹系统,在LDA改进模型对用户的兴趣进行解析的基础上,对用户的知识分布进行进一步的描摹;
本发明从用户兴趣描述层面进行扩展,提出根据知识与兴趣两个方面的描摹方式进行用户描述的方法,精准对用户进行个性化刻画;加入互联网用户知识层级的概念,将知识层级融合进LDA改进模型当中,提出互联网用户的知识与兴趣个性化描摹系统;用户兴趣建模中,主要采用关键词模型对用户兴趣进行建模,在用户知识建模中,将知识层级这纳入用户的知识描摹模型当中来,以有向连通图对用户知识建模;
互联网用户知识与兴趣个性化描摹模型的用户解析有如下三个层级:
第一层级,对于每个用户v,对应多个主题的兴趣和已有知识,生成主题分布x,用户-兴趣分布j和用户-知识分布w;
第二层级,对于每条微博q,对应一个主题的兴趣度量和已有知识程度量两方面,生成兴趣-微博分布ej,知识-微博分布ew;
第三层级,对于每个词k,对应多个主题,生成主题-词分布s;
互联网用户的知识与兴趣个性化描摹解析概率模型的生成过程为:
过程一,采样分布:Gv,x-Dirichlet(B),Lv,w-Dirichlet(T),Fv,j-Dirichlet(E),
Rv,w-Dirichlet(S);
过程二,对于每一个用户v=1,2,...,V,
采样分布:Hv-Dirichlet(Av),H-Binomial(π);
采样分布:jv-Dirichlet(Fv);
采样分布:wv-Dirichlet(Rv);
过程三,对于每一条微博q=1,2,...,Q,
采样主题:x-Multinomial(Hv);
采样微博描述话题的深度类型z-Multinomial(wv);
过程四,对于每一个词k=1,2,...,K,
采样词:kn,m-Multinomial(Gv,x);
用户知识与兴趣描摹模型参数说明:Av,B,T,E,S为超参数和Dirichlet先验分布;π为超参数和Binomial先验分布;H为|V|*|X|维矩阵,表示用户-话题分布;G为|V|*|X|*|K|维矩阵,表示用户-话题-词分布;R为|V|*|X|*|W|维矩阵,表示用户-话题-知识分布;F为|V|*|X|*|J|维矩阵,表示用户-话题-兴趣分布;L为|V|*|W|*|Z|维矩阵,表示用户-知识-层级分布;v,j,x,w,z,k为变量实例:用户v,用户兴趣j,话题x,已有知识w,知识层次z,词k;V,J,X,W,Z,K分别表示用户集合,兴趣集合,话题集合,知识集合,层级集合,词集合。
2.根据权利要求1所述的互联网用户的知识与兴趣个性化描摹系统,其特征在于,构建用户知识与兴趣个性化模型包括构建互联网用户兴趣模型和构建互联网用户知识模型;
互联网用户兴趣建模采用关键词用户兴趣表达模型,用一个关键词列表来呈现一个用户的兴趣,通过这样的方式获取关键词表示出一个用户,通过各种挖掘技术或机器学习的方式获取一个用户的关键词集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荆门汇易佳信息科技有限公司,未经荆门汇易佳信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011641277.4/1.html,转载请声明来源钻瓜专利网。