[发明专利]维基百科条目质量评价方法有效
申请号: | 201510388240.8 | 申请日: | 2015-07-03 |
公开(公告)号: | CN104933185B | 公开(公告)日: | 2018-12-04 |
发明(设计)人: | 曹静;肖奎;吴天吉 | 申请(专利权)人: | 武汉商学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京远大卓悦知识产权代理事务所(普通合伙) 11369 | 代理人: | 张云花 |
地址: | 430056 湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 条目 维基百科 质量评价 分类 信誉度 性系数 页面 读取 筛选 链接关系 数据量化 关联度 迭代 直观 分析 网络 | ||
本发明公开了一种维基百科条目质量评价方法,包括:步骤一、在维基百科选择一个分类,读取所述分类的全部的直接隶属页面,分析所述直接隶属页面对应的条目的链接关系网络的相互性系数,根据所述相互性系数筛选有意义的分类作为领域;步骤二、采用迭代的方式计算所述领域里各条目的质量值,以及编辑者在所述领域的信誉度值。本发明能够筛选条目之间相互关联度强的分类认定为有意义的分类并作为领域,提高条目质量评价的效率,根据数据量化的方式高效评价条目的质量值和编辑者的信誉度值,解决维基百科知识质量评价问题,更加准确、直观。
技术领域
本发明涉及计算机应用技术的技术领域,具体地涉及维基百科条目质量评价方法。
背景技术
自创建以来,维基百科已发展成为世界上最知名的互联网百科全书。截至2014年底,维基百科里包含了288种语言撰写的三千多万个条目,同时拥有分布在世界各地的五千多万名编辑者。其中,规模最大的英语维基百科包含四百多万个条目,编辑者人数超过两千万。
虽然维基百科条目数量要远远的超过《大英百科全书》等传统的百科全书,但是条目内容的质量却无法与专家编纂的传统百科全书相提并论。为了帮助用户辨别高质量的条目,同时促进编辑者改进低质量的条目,维基百科把条目按照质量的优劣分为七个等级:特色、甲级、优良、乙级、丙级、初级与小作品。同时采用同行评审的方式确定条目属于哪个质量等级。但是,由于维基百科的条目数量增长过快,人工评价条目质量的方法无法跟上维基百科快速增长的节奏。实际上,在维基百科里仅有少数条目通过同行评审的方式确定了质量,大多数条目的质量处于未知状态。
现在已有一些自动评价维基百科条目质量的方法。这些方法大多数是基于分类的方法,即把样本里的条目简单的分为高质量条目与低质量条目两类。但是,维基百科里的条目质量千差万别,简单的分类无法反应条目质量的真实情况。
因此,目前亟需一种自动化程度高、评价结果准确的维基百科条目质量评价方法,能够与同行评审的结果吻合,并自动评价未分等级的条目。
发明内容
本发明的一个目的是解决至少上述问题和/或缺陷,并提供至少后面将说明的优点。
本发明还有一个目的是提供一种筛选维基百科的有意义的分类的方法,其能够筛选条目之间相互关联度强的分类认定为有意义的分类并作为领域,提高条目质量评价的效率。
本发明还有一个目的是提供一种维基百科条目质量评价方法,根据数据量化的方式高效评价条目的质量值和编辑者的信誉度值,解决维基百科知识质量评价问题,更加准确、直观。
为了实现根据本发明的这些目的和其它优点,提供了一种维基百科条目质量评价方法,包括:
步骤一、在维基百科选择一个分类,读取所述分类的全部的直接隶属页面,分析所述直接隶属页面对应的条目的链接关系网络的相互性系数,根据所述相互性系数筛选有意义的分类作为领域;
步骤二、采用迭代的方式计算所述领域里各条目的质量值,以及编辑者在所述领域的信誉度值。
优选的是,所述的维基百科条目质量评价方法,在所述步骤一之前,还包括对维基百科的原始数据预处理,包括:
S1、在维基百科的原始数据里的分类隶属关系表categorylinks、条目链接关系表pagelinks与条目重定向关系表redirect读取包含的条目或分类的名称title、名称空间namespace,并在维基百科的页面基本信息数据表page查询所述条目或分类相应的编号id,并将分类隶属关系表categorylinks、条目链接关系表pagelinks和条目重定向关系表redirect中的条目或分类的名称title、名称空间namespace更换为查询到的条目或分类相应的编号id;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉商学院,未经武汉商学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510388240.8/2.html,转载请声明来源钻瓜专利网。