[发明专利]一种网络社区用户识别方法、装置和可读存储介质有效
申请号: | 201811544400.3 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109783805B | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 吴旭;许晋;颉夏青;戴雨伦 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/289;G06Q50/00;G06N3/04;G06N3/08 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开一种网络社区用户识别方法及装置,涉及机器学习及用户识别技术领域。所述方法包括:提取预先收集的网络社区文本数据的第一N‑gram特征并生成第一词向量;以交叉熵为代价函数,采用深度神经网络对第一词向量进行训练,得到文本内容分析模型;使用文本内容分析模型分析待识别用户的文本数据,得到内容属性;使用预设行为分析模型分析待识别用户的行为数据,得到行为属性;根据内容属性和行为属性识别待识别用户。本申请中,引入N‑gram特征,并结合用户内容以及用户行为两个维度的数据进行目标用户的识别,相较于现有的单一维度数据的用户识别,大大提升了识别性能及准确度。 | ||
搜索关键词: | 一种 网络 社区 用户 识别 方法 装置 可读 存储 介质 | ||
【主权项】:
1.一种网络社区用户识别方法,其特征在于,包括:提取预先收集的网络社区文本数据的第一N‑gram特征并生成第一词向量;以交叉熵为代价函数,采用深度神经网络对所述第一词向量进行训练,得到文本内容分析模型;使用所述文本内容分析模型分析待识别用户的文本数据,得到内容属性;使用预设行为分析模型分析所述待识别用户的行为数据,得到行为属性;根据所述内容属性和所述行为属性识别所述待识别用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811544400.3/,转载请声明来源钻瓜专利网。