[发明专利]一种识别广告弹幕发布者的方法及系统在审
申请号: | 201910982059.8 | 申请日: | 2019-10-16 |
公开(公告)号: | CN112667961A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 王璐 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F40/279;H04L29/12;H04N21/4788;H04N21/488 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 430000 湖北省武汉市东湖开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 广告 弹幕 发布者 方法 系统 | ||
1.一种识别广告弹幕发布者的方法,其特征在于,所述方法包括:
获取过去预设时间段内的目标基础标识数据,其中,所述目标基础标识数据包括目标IP信息、设备信息和目标昵称信息;
基于所述目标IP信息、设备信息和目标昵称信息,获得目标间的IP紧密度、设备紧密度和昵称紧密度;
基于所述目标间的IP紧密度、设备紧密度和昵称紧密度,获得所述目标间的紧密度;
基于所述目标间的紧密度,获得所述目标的发送广告弹幕次数期望;
判断所述目标的发送广告弹幕次数期望是否大于次数阈值以及所述目标是否发送过广告弹幕;
若所述目标的发送广告弹幕次数期望大于次数阈值,且所述目标未发送过广告弹幕,则将广告弹幕次数期望高于次数阈值且未发送过广告弹幕的目标识别为广告弹幕的发布者。
2.如权利要求1所述的方法,其特征在于,所述基于所述目标IP信息、设备信息和目标昵称信息,获得目标间的IP紧密度、设备紧密度和昵称紧密度,具体包括:
基于所述目标IP信息,获得目标u与目标v的IP紧密度;其中,所述IP紧密度包括:
sim_ip(IPu,IPv)=0,表示目标u与目标v共用过0个IP;
sim_ip(IPu,IPv)=0.5,表示目标u与目标v共用过一个IP;
sim_ip(IPu,IPv)=1,表示目标u与目标v共用过两个或两个以上IP;
sim_ip(IPu,IPv)表示目标u与目标v的IP紧密度;
基于所述设备信息,获得目标u与目标v的设备紧密度;其中,所述设备紧密度包括:
sim_did(Du,Dv)=0,表示目标u与目标v共用过0个设备;
sim_did(Du,Dv)=1,表示目标u与目标v共用过一个或一个以上设备;
sim_did(Du,Dv)表示目标u与目标v间的设备紧密度;
基于所述目标昵称信息,获得目标u与目标v的昵称紧密度,包括:
将所述目标昵称中相同的字符类型转换成同一英文字母,获得昵称模式;其中,不同的字符类型转换成不同的英文字母;
基于所述昵称模式,获得昵称紧密度,所述昵称紧密度包括:
其中:
sim_nick(u,v)表示目标u与目标v的昵称紧密度;
levenstein(nicku,nickv)是目标u与目标v的昵称模式编辑距离;
length(nicku)是目标u的昵称模式字符串长度,length(nickv)是目标v的昵称模式字符串长度。
3.如权利要求2所述的方法,其特征在于,所述基于所述目标间的IP紧密度、设备紧密度和昵称紧密度,获得所述目标间的紧密度,具体包括:
通过所述目标u与目标v的IP紧密度、设备紧密度和昵称紧密度,获得所述目标u与目标v的紧密度,所述目标u与目标v的紧密度包括:
sim(u,v)=w1sim_ip(u,v)+w2sim_did(u,v)+w3sim_nick(u,v),
其中:
sim(u,v)是目标u与目标v的紧密度;
wi(i=1,2,3)是权重系数,取值在0到1之间,并且满足
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910982059.8/1.html,转载请声明来源钻瓜专利网。