[发明专利]一种广告识别方法及装置在审
申请号: | 201910728853.X | 申请日: | 2019-08-08 |
公开(公告)号: | CN110457597A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 任宁;晋耀红;李德彦 | 申请(专利权)人: | 中科鼎富(北京)科技发展有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/958;G06Q50/00;G06Q30/02 |
代理公司: | 11363 北京弘权知识产权代理事务所(普通合伙) | 代理人: | 逯长明;许伟群<国际申请>=<国际公布> |
地址: | 100089北京市海淀区万*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 广告信息 媒体信息 广告权 分类模型 权重因素 预设 广告 广告信息确定 广告识别 社交平台 用户发布 有效地 两级 申请 发布 筛选 分类 图片 | ||
1.一种广告识别方法,其特征在于,包括:
使用包含分类表达式的分类模型从用户发布的媒体信息中获取疑似广告信息;
根据预设的至少一种权重因素生成所述疑似广告信息的广告权重;所述权重因素包括所述疑似广告信息占所述媒体信息全文的长度比重,用户已发布的广告信息占用户已发布的全部媒体信息的比重,以及所述疑似广告信息中的图片数量中的一个或多个;
将所述广告权重大于预设阈值的所述疑似广告信息确定为广告信息。
2.根据权利要求1所述的方法,其特征在于,所述使用包含分类表达式的分类模型从用户发布的媒体信息中获取疑似广告信息之前,还包括:
所述媒体信息进行预处理;所述预处理包括从所述媒体信息中去除特定字符,对所述媒体信息进行字符转换,以及对所述媒体信息进行汉字转数字的一个或多个。
3.根据权利要求1所述的方法,其特征在于,
所述分类模型包括至少一个分类节点,每个所述分类节点对应一个广告类别,每个广告类别对应一个类别权重;每个所述分类节点包括至少一个分类表达式,所述分类表达式用于从所述媒体信息中识别出所述疑似广告信息。
4.根据权利要求3所述的方法,其特征在于,所述根据预设的至少一种权重因素生成所述疑似广告信息的广告权重,包括:
将每一种所述权重因素乘以对应的权重系数,得到每一种所述权重因素的权值;
将所述疑似广告信息的类别权重与各个所述因素权重的权值相加,得到所述广告权重。
5.根据权利要求4所述的方法,其特征在于,
所述权重因素的权值包括第一权值,所述第一权值为所述疑似广告信息占所述媒体信息全文的长度比重与第一权重系数的乘积。
6.根据权利要求4所述的方法,其特征在于,
所述权重因素的权值包括第二权值,所述第二权值为用户已发布的广告信息占用户已发布的全部媒体信息的比重与第二权重系数的乘积。
7.根据权利要求4所述的方法,其特征在于,
所述权重因素的权值包含第三权值,所述第三权重为所述疑似广告信息中的图片数量与第三权重系数的乘积。
8.根据权利要求1所述的方法,其特征在于,所述疑似广告信息的长度通过以下步骤获取:
分别获取每个分类表达式匹配到的所述疑似广告信息的起始位置和结束位置;
根据所述起始位置和结束位置判断所述疑似广告信息的位置是否存在交集;
如果所述疑似广告信息的位置存在交集,将所述疑似广告信息中的结束位置最大值与起始位置最小值的差值作为所述疑似广告信息的长度。
9.根据权利要求1所述的方法,其特征在于,所述将广告权重大于预设阈值的所述疑似广告信息确定为广告信息之后,还包括:
更新用户已发布的广告信息的数量;
判断用户已发布的广告信息的数量是否大于数量阈值;
当用户已发布的广告信息的数量大于数量阈值时,封禁用户的IP地址并删除用户的账号信息。
10.一种广告识别装置,其特征在于,包括:
信息获取模块,用于使用包含分类表达式的分类模型从用户发布的媒体信息中获取疑似广告信息;
权重生成模块,用于根据预设的至少一种权重因素生成所述疑似广告信息的广告权重;所述权重因素包括所述疑似广告信息占所述媒体信息全文的长度比重,用户已发布的广告信息占用户已发布的全部媒体信息的比重,以及所述疑似广告信息中的图片数量中的一个或多个;
广告确定模块,用于将所述广告权重大于预设阈值的所述疑似广告信息确定为广告信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科鼎富(北京)科技发展有限公司,未经中科鼎富(北京)科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910728853.X/1.html,转载请声明来源钻瓜专利网。