[发明专利]基于人工智能的低质量文章识别方法及装置、设备及介质有效

专利信息
申请号: 201710469542.7 申请日: 2017-06-20
公开(公告)号: CN107491432B 公开(公告)日: 2022-01-28
发明(设计)人: 乔超;黄波;李大任;佘俏俏 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F40/279 分类号: G06F40/279;G06F40/289;G06F16/35;G06F16/9535;G06K9/62
代理公司: 北京鸿德海业知识产权代理有限公司 11412 代理人: 袁媛
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 人工智能 质量 文章 识别 方法 装置 设备 介质
【说明书】:

发明提供一种基于人工智能的低质量文章识别方法及装置、设备及介质。其方法包括:获取新闻推荐系统中的待识别的文章的用户反馈行为特征;根据待识别的文章的用户反馈行为特征和预先确定的低质量文章识别模型,识别待识别的文章是否为低质量的文章。本实施例的技术方案,能够根据待识别的文章的用户反馈行为特征和预先确定的低质量文章识别模型自动地对待识别的文章是否为低质量的文章进行识别,从而克服现有技术中人工审核待识别的文章是否为低质量的文章,费时费力且识别效率低的技术问题,不仅能够大大地节省对待识别的文章是否为低质量的文章进行识别的时间,还能够有效节省识别时消耗的人力成本,进而大大地提高对低质量文章的识别效率。

【技术领域】

本发明涉及计算机应用技术领域,尤其涉及一种基于人工智能的低质量文章识别方法及装置、设备及介质。

【背景技术】

人工智能(Artificial Intelligence;AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

随着移动互联网技术的发展以及移动终端的使用普及,为了更加方便用户通过移动终端能够及时浏览各种最新的新闻资源,市面上逐步涌现出了很多的新闻推荐系统。新闻推荐系统可以根据对用户的自画像,了解用户的兴趣,从而根据用户的兴趣有针对性地向用户推荐的用户感兴趣的文章。但是现有技术中,新闻推荐系统中包括的文章良莠不齐,可能包括一些权威性的高质量的文章,也可能包括一些粗俗、虚假新闻、或者故意吸引用户眼球的、诽谤事实的一些低质量的文章。为了防止低质量的文章继续在网络环境中污染网络资源,新闻推荐系统中会对新闻推荐系统的文章库中包括的所有文章进行人工审核,以识别出低质量的文章,并加以屏蔽或者其他处理。

但是,现有技术中通过人工审核的方式对新闻推荐系统的文章库中的所有文章进行审核,导致低质量文章的识别过程非常的费时费力,低质量文章的识别效率非常低。

【发明内容】

本发明提供了一种基于人工智能的低质量文章识别方法及装置、设备及介质,用于提高低质量文章的识别效率。

本发明提供一种基于人工智能的低质量文章识别方法,所述方法包括:

获取新闻推荐系统中的待识别的文章的用户反馈行为特征;

根据所述待识别的文章的所述用户反馈行为特征和预先确定的低质量文章识别模型,识别所述待识别的文章是否为低质量的文章。

进一步可选地,如上所述的方法中,还包括:

获取新闻推荐系统中的待识别的文章的特征;

对应地,根据所述待识别的文章的所述用户反馈行为特征和预先确定的低质量文章识别模型,识别所述待识别的文章是否为低质量的文章,具体还包括:

根据所述待识别的文章的所述用户反馈行为特征和预先确定的所述低质量文章识别模型,并结合所述待识别的文章的特征,识别所述待识别的文章是否为低质量的文章。

进一步可选地,如上所述的方法中,根据所述待识别的文章的所述用户反馈行为特征和预先确定的低质量文章识别模型,识别所述待识别的文章是否为低质量的文章之前,所述方法还包括:

采集已知类别为低质量的文章或非低质量的文章的数篇训练文章中各所述训练文章对应的用户反馈行为特征,作为训练数据,得到数条训练数据;

根据所述数条训练数据,训练所述低质量文章识别模型。

进一步可选地,如上所述的方法中,各条所述训练数据中还包括对应的所述训练文章的特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710469542.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top