[发明专利]高质量用户生成内容的识别方法在审
申请号: | 201910328448.9 | 申请日: | 2019-04-23 |
公开(公告)号: | CN110110084A | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 闫相斌;谷炜;张婷婷;石美珠 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06F16/9535;G06F17/27 |
代理公司: | 北京久诚知识产权代理事务所(特殊普通合伙) 11542 | 代理人: | 余罡 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供高质量UGC的识别方法,涉及互联网技术领域。所述高质量UGC的识别方法包括:获取用户数据;基于预先设置的用户属性特征和指标对所述用户数据分类汇总并测算,对用户数据进行标准化处理;基于处理后的用户数据计算所述指标的权重;综合所述指标的权重计算用户的价值;根据用户的价值设置预设用户,并提取预设用户的回复文本;对所述回复文本进行预处理;对所述回复文本进行聚类分析。本发明综合用户生成内容的质量信息和用户的属性信息两方面识别UGC,可以准确识别出高质量的UGC。 | ||
搜索关键词: | 用户数据 回复 文本 预设 预处理 用户生成内容 标准化处理 互联网技术 聚类分析 权重计算 属性信息 用户属性 预先设置 质量信息 综合用户 权重 测算 分类 | ||
【主权项】:
1.一种高质量UGC的识别方法,其特征在于,包括以下步骤:获取用户数据;基于预先设置的用户属性特征和指标对所述用户数据分类汇总并测算,对用户数据进行标准化处理;基于处理后的用户数据计算所述指标的权重;综合所述指标的权重计算用户的价值;根据用户的价值设置预设用户,并提取预设用户的回复文本;对所述回复文本进行预处理;对所述回复文本进行聚类分析;所述预先设置的用户属性特征和指标基于以下步骤获取:基于UGC的质量信息和用户的属性信息两方面归纳用户属性特征,所述用户的属性信息归纳的用户属性特征包括:网络连接强度和个人社区属性;将所述用户属性特征转化为可定量化测量的指标。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910328448.9/,转载请声明来源钻瓜专利网。