[发明专利]一种基于文字交互行为的用户特征建模方法在审
申请号: | 201510883613.9 | 申请日: | 2015-12-04 |
公开(公告)号: | CN105320647A | 公开(公告)日: | 2016-02-10 |
发明(设计)人: | 廖建新;沈奇威;张涛;张磊;朱晓民 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于文字交互行为的用户特征建模方法,包括:采集用户发表文字,将文字进行分词,并将每个分词转化成词向量,再将用户发表文字转化成文字向量,同时为每个用户分别构建喜好特征向量和自身特征向量;计算不同用户对其主动交互的其它用户的关注强度,并为每个用户构建一个深度关注用户群,然后构建以所有用户为节点的用户深度关注网络图,网络图中,每个用户各为一个节点,且存在由用户节点指向其深度关注的用户节点的有向边,有向边权值为用户节点对其深度关注的用户的关注强度;根据用户深度关注网络图,计算用户的喜好特征向量和自身特征向量。本发明属于互联网技术领域,能基于用户的文字交互行为来挖掘用户的个性化特征。 | ||
搜索关键词: | 一种 基于 文字 交互 行为 用户 特征 建模 方法 | ||
【主权项】:
1.一种基于文字交互行为的用户特征建模方法,其特征在于,包括有:步骤一、采集每个用户发表的文字,将文字进行分词,并将每个分词转化成一个词向量,再根据文字所包含的分词,将用户发表的文字转化成相应的文字向量,同时为每个用户分别构建两个向量:喜好特征向量和自身特征向量;步骤二、根据用户之间的关注和交互记录,计算不同用户对其主动交互的其它用户的关注强度,并为每个用户构建一个深度关注用户群,然后根据不同用户的深度关注用户群,构建以所有用户为节点的用户深度关注网络图,所述用户深度关注网络图中,每个用户各为一个节点,且存在有由每个用户节点指向其深度关注的用户节点的有向边,所述有向边的权值为用户节点对其深度关注的用户的关注强度;步骤三、根据用户深度关注网络图中每个用户节点的有向边的权值,分别计算每个用户的喜好特征向量和自身特征向量,步骤二中,根据用户之间的关注和交互记录,计算任一用户Ua 对其主动交互的其它用户的关注强度,进一步包括有:步骤211、从用户Ua 的关注和交互记录中,寻找用户Ua 主动交互的所有其他用户;步骤212、从用户Ua 主动交互的所有其他用户中提取其中一个用户;步骤213、根据用户Ua 对提取用户的关注时间、和每次主动交互的发生时间距离当前日期的天数,计算用户Ua 对提取用户的关注强度: 其中,Ut 是提取用户,S(Ua ,Ut )是用户Ua 对提取用户Ut 的关注强度,g(Ua ,Ut )是用户Ua 对提取用户Ut 的关注权重系数, 是用户Ua 对提取用户Ut 的主动交互强度,Mj 是用户Ua 对提取用户Ut 的主动交互次数,k是主动交互系数,k是一个大于0的实数, 是用户Ua 对提取用户Ut 的第m次主动交互的发生时间距离当前日期的天数,m是1到Mj 之间的一个自然数;步骤214、判断是否已提取完用户Ua 主动交互的所有其他用户,如果否,则继续从用户Ua 主动交互的所有其他用户中提取下一个用户,转向步骤213。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510883613.9/,转载请声明来源钻瓜专利网。
- 上一篇:资源的下载方法及装置
- 下一篇:中文企业名称的识别方法