[发明专利]一种评价网络文章的方法和装置在审
申请号: | 201810890782.9 | 申请日: | 2018-08-07 |
公开(公告)号: | CN109543090A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 鄢军;孙家宇;宋小亮 | 申请(专利权)人: | 宜人恒业科技发展(北京)有限公司;普信恒业科技发展(北京)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F17/27 |
代理公司: | 上海衡方知识产权代理有限公司 31234 | 代理人: | 朱穆峰 |
地址: | 100022 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络文章 维度 计算机可读存储介质 方法和装置 电子设备 客观评价 热度信息 | ||
本发明的实施方式提供了一种评价网络文章的方法。该方法包括:获取待评价的网络文章;提取待评价的网络文章的评分维度的信息;基于评分维度的信息得到网络文章评分。本发明给出的一种客观评价网络文章的方法,最大限度地避免了热度信息对评价网络文章产生的不良影响。此外,本发明的实施方式还提供了一种评价网络文章的装置、一种电子设备以及一种计算机可读存储介质。
技术领域
本发明的实施方式涉及数据挖掘领域,更具体地,本发明的实施方式涉及一种评价网络文章的方法、一种评价网络文章的装置、一种电子设备以及一种计算机可读存储介质。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
网络上每天新出现的文章数以万计,这些网络文章良莠不齐,需要有一种方法从这些海量网络文章中筛选出高质量的文章给用户。
目前现有技术主要是利用用户的反馈信息,比如阅读点击数、阅读时长、用户评论和收藏等信息来判断网络文章的质量。但是阅读点击数、阅读时长、用户评论和收藏等信息都是热度信息,其可以在一定程度上反映热门新闻,但并不能真正客观地反映网络文章的质量。此外,上述热度信息很可能是网络机器人或水军操纵完成的。因此,现有技术利用热度信息给用户推荐的所谓高质量网络文章是不准确的,其中很多网络文章质量低劣,严重影响了用户阅读体验。
发明内容
发明人认识到,目前很多网络文章充斥着广告营销等相关的内容,同时也有很多标题党泛滥的网络文章,其标题往往哗众取宠、赚用户眼球,但与真实内容却相差甚远;还有很多文章内容排版混乱,重点不清晰,严重影响阅读质量和感受。目前的网络文章质量评价方法,基本上都是从热度信息维度来衡量,这并不是一种客观的评价方法。
发明人认为,高质量的网络文章必须具有长度适宜、优质排版、内容丰富、图文并茂、重点突出等特点,而这些特点是可以通过量化的方法来评价的。
基于上述认识,本发明的实施方式期望提供一种评价网络文章的方法、一种评价网络文章的装置、一种电子设备以及一种计算机可读存储介质。
在本发明实施方式的第一方面中,提供了一种评价网络文章的方法,包括:获取待评价的网络文章;提取待评价的网络文章的评分维度的信息;基于评分维度的信息得到网络文章评分。
在本发明的一个实施例中,所述网络文章包括图片。
在本发明的另一实施例中,所述评分维度是内容长度、标题长度、图片密度、字符标记、表格样式、层次标记、关联程度以及段落分布中的任意一种或多种。
在本发明的又一个实施例中,所述字符标记是指粗体、斜体、下划线以及颜色中的任意一种或多种。
在本发明的再一个实施例中,所述关联程度是指网络文章的标题和正文之间的关联度。
在本发明的再一个实施例中,所述网络文章的标题和正文之间的关联度是基于TF-IDF算法计算的。
在本发明的再一个实施例中,所述基于评分维度的信息得到网络文章评分是基于每个评分维度的得分加权求和得到。
在本发明实施方式的第二方面中,提供了一种评价网络文章的装置,包括:获取模块,用于获取待评价的网络文章;提取模块,用于提取待评价的网络文章的评分维度的信息;评分模块,用于基于评分维度的信息得到网络文章评分。
在本发明的一个实施例中,所述网络文章包括图片。
在本发明的另一实施例中,所述评分维度是内容长度、标题长度、图片密度、字符标记、表格样式、层次标记、关联程度以及段落分布中的任意一种或多种。
在本发明的又一个实施例中,所述字符标记是指粗体、斜体、下划线以及颜色中的任意一种或多种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宜人恒业科技发展(北京)有限公司;普信恒业科技发展(北京)有限公司,未经宜人恒业科技发展(北京)有限公司;普信恒业科技发展(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810890782.9/2.html,转载请声明来源钻瓜专利网。