[发明专利]一种基于人工智能自动屏蔽或提示软文广告的方法和系统在审

专利信息
申请号: 201811542709.9 申请日: 2018-12-17
公开(公告)号: CN109635115A 公开(公告)日: 2019-04-16
发明(设计)人: 卞西晗;张连聘 申请(专利权)人: 济南浪潮高新科技投资发展有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F16/951;G06N3/04
代理公司: 济南信达专利事务所有限公司 37100 代理人: 陈婷婷
地址: 250100 山东省济南市*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 软文 自然语言分析 人工智能 自动屏蔽 广告 卷积神经网络 提示 网页 人工智能技术 数据采集模块 数据处理模块 数据分析模块 广告内容 明显位置 屏蔽软件 网络应用 文字内容 用户上网 正文文字 分类 屏蔽 上网 分辨 预测 维护
【说明书】:

发明公开了一种基于人工智能自动屏蔽或提示软文广告的方法和系统,属于网络应用及人工智能技术领域,该方法通过设置屏蔽软件,获取网页的正文文字内容,并将获取的文字内容通过自然语言分析卷积神经网络进行分类;通过自然语言分析卷积神经网络分类预测为正文中含有广告内容的网页被定义为软文文章;根据设置,被定义为软文文章的网页无法打开或打开时在明显位置标记为软文。一种基于人工智能自动屏蔽或提示软文广告的系统,包括数据采集模块、数据分析模块、数据处理模块和自然语言分析模块。本发明能够有效分辨及屏蔽软文广告,减少用户上网时受软文广告的干扰,维护用户的权利,节省上网时间。

技术领域

本发明涉及网络应用及人工智能技术领域,具体地说是一种基于人工智能自动屏蔽或提示软文广告的方法和系统。

背景技术

广义的软文广告通常指企业通过策划在报纸、杂志或网络等宣传载体上刊登的可以提升企业品牌形象和知名度,或可以促进企业销售的一些宣传性、阐释性文章,包括特定的新闻报道、深度文章、付费短文广告、案例分析等。软文一般泛指所有含有软性宣传的文字内容,是相对于硬性广告而言,由企业的市场策划人员或广告公司的文案人员来负责撰写的文字广告。与硬广告相比,软文之所以叫做软文,精妙之处就在于一个软字,好似绵里藏针,收而不露,克敌于无形,等到发现这是一篇软文的时候,你已经冷不丁的掉入了被精心设计过的软文广告陷阱。

在当前的网络环境中,网络软文正在逐渐成为网络广告的主流载体,同时,因其具有极强的效果和传播能力,对消费者群体的影响是巨大的,而且目前各网络媒体平台为了保护自身利益,对软文广告基本采取放任态度。消费者群体急需通过技术手段有效的对网络软文进行过滤和屏蔽。

发明内容

本发明的技术任务是针对以上不足之处,提供一种基于人工智能自动屏蔽或提示软文广告的方法和系统,能够有效分辨及屏蔽软文广告,减少用户上网时受软文广告的干扰,节省时间。

本发明解决其技术问题所采用的技术方案是:

一种基于人工智能自动屏蔽或提示软文广告的方法,该方法通过设置屏蔽软件,获取网页的正文文字内容,并将获取的文字内容通过自然语言分析卷积神经网络进行分类;

通过自然语言分析卷积神经网络分类预测为正文中含有广告内容的网页被定义为软文文章;

根据设置,被定义为软文文章的网页无法打开或打开时在明显位置标记为软文。

其中所述的自然语言分析卷积神经网络在使用前进行训练,设定判别软文文章标准,在使用时,根据用户的标记进行训练与更新。

具体的,该方法的实现步骤如下:

所述屏蔽软件在用户点击某个链接后,预先扫描网页内容,通过html标签获取网页正文内容,包括文字内容和图片内容;

将获取的网页主体内容中的文字部分存入待处理数据,网页中的图片部分则通过图片转换文字软件进行转换,图片转换的文字也存入待处理数据;

对待处理数据进行预处理,使其符合卷积神经网络输入要求,预处理后的数据作为输入数据输入卷积神经网络进行自然语言分析;

通过卷积神经网络进行的自然语言分析,判断该网页内容是否为软文广告;

若判定为软文广告,则根据用户设置对网页进行屏蔽或在加载网页时添加软文广告标识,提醒用户注意。

优选的,所述数据预处理通过正则表达式的方式去除待处理数据中的不符合神经网络输入要求的数据,将数据扁平化,重新分布权值。

进一步的,所述不符合神经网络输入要求的数据包括数字、符号及英文。

优选的,所述数据处理还包括分词和计算词频。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司,未经济南浪潮高新科技投资发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811542709.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code