[发明专利]一种提升多标签分类正确率的方法及系统在审
申请号: | 202110811924.X | 申请日: | 2021-07-19 |
公开(公告)号: | CN113407853A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 邹时新 | 申请(专利权)人: | 无锡路途网络科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06Q50/00 |
代理公司: | 深圳紫晴专利代理事务所(普通合伙) 44646 | 代理人: | 陈映辉 |
地址: | 214000 江苏省无锡市锡*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提升 标签 分类 正确率 方法 系统 | ||
本发明提供一种提升多标签分类正确率的方法及系统,包括以下步骤:S1.获取需分类的社交媒体用户中每一个需分类的用户对多个监控自媒体运营平台的在线信息;S2.根据每一个需分类的用户对多个监控自媒体运营平台的在线信息,获取每个所述的需分类的用户的自媒体运行数据;S3.基于各个所述的需分类的用户的自媒体运行数据,将所述的需分类的社交媒体用户划分成多个标签分类。本发明够根据需分类的用户对自媒体运营平台的使用情况以及每个自媒体运营平台的主题标签,确定需分类的用户的在线信息,更加全面的在线信息来对用户群体特征进行挖掘,能够得到更全面完整的挖掘结果。
技术领域
本申请涉及数据分析技术领域,具体而言,涉及一种提升多标签分类正确率的方法及系统。
背景技术
社交媒体作为互联网时代的产物,已经成为人们生活中不可或缺的一部分,用户账号作为信息的发布者和传播者,蕴藏着大量有价值的数据信息。因此对海量账号进行有针对性地识别和分类,有利于减少传统账号管理系统构建所需的人力资源和时间成本,同时也能更全面有效地获取某个领域的实时信息和动态。
现有技术一般通过获取注册用于在线信息来确定其自媒体运行数据。但是注册用于在使用的时候,可能会同时使用多个自媒体,所以是很难全面获取其完整自媒体运行数据的。因而这种自媒体运行数据的获取方法存在全面性差的技术问题。
发明内容
针对上述技术问题,本申请提供一种提升多标签分类正确率的方法及系统,能够基于用户对自媒体运营平台的使用情况来确定用户的自媒体运行数据,并基于自媒体运行数据对社交媒体用户进行标签分类,基于这种标签分类结果对社交媒体用户特征进行挖掘,能够提高挖掘信息的全面性。
一种提升多标签分类正确率的方法,包括以下步骤:
S1.获取需分类的社交媒体用户中每一个需分类的用户对多个监控自媒体运营平台的在线信息;
S2.根据每一个需分类的用户对多个监控自媒体运营平台的在线信息,获取每个所述的需分类的用户的自媒体运行数据;
S3.基于各个所述的需分类的用户的自媒体运行数据,将所述的需分类的社交媒体用户划分成多个标签分类。
优选的,S1之前,还包括以下步骤:
S0.确定主题领域;
将主题标签归属于所述的主题领域的多个自媒体运营平台确定为监控自媒体运营平台;
以及,将使用所述的监控自媒体运营平台的数量达到监控数量阈值的个体,确定为所述的需分类的用户。
进一步的,S1中所述的在线信息包括:在线时间;
S1的具体包括以下步骤:
针对每个需分类的用户,获取监控历史时间段内,所述的需分类的用户与各个监控自媒体运营平台的在线时间;
S2具体包括以下步骤:
针对每个需分类的用户,按照所述的需分类的用户与各个监控自媒体运营平台之间在线时间的先后顺序,以及每个监控自媒体运营平台的位置信息,生成所述的需分类的用户的自媒体运行数据。
优选的,S3具体包括以下步骤:
基于所述的各个需分类的用户的自媒体运行数据,对所述的需分类的社交媒体用户中的各个所述的需分类的用户进行聚类,获得多个所述的标签分类。
进一步的,S3后,还包括以下步骤:
S4.针对每个标签分类,基于所述的标签分类中所包括的各个需分类的用户对各个监控自媒体运营平台的在线次数信息,对所述的标签分类中所包括的多个需分类的用户进行分类,获得与所述的标签分类对应的至少一个子分类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡路途网络科技有限公司,未经无锡路途网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110811924.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑垃圾自动化分类处理系统
- 下一篇:气动盾闸埋件及其施工方法