[发明专利]基于博客的主题专家识别算法在审
申请号: | 201611085285.9 | 申请日: | 2016-11-30 |
公开(公告)号: | CN106600431A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 李宇佳 | 申请(专利权)人: | 上海电机学院 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F17/30 |
代理公司: | 上海申汇专利代理有限公司31001 | 代理人: | 翁若莹,柏子雵 |
地址: | 201100 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于博客的主题专家识别算法,得出所有博客关于某个主题的主题质量分,将所有博客按照主题质量分的高低进行排序。本发明基于目前主题识别和博客社区抽取算法中存在的主要缺陷(如社区很小、主题意义不明确、成员内聚性弱、社区成员构成复杂等),设计了一个有效的方法,具有如下优点综合考虑博文长度、评论长度、评论次数、评论质量、评论者的质量等多种因素,来对一个博客进行质量分评定,通过迭代使得质量分达到一个稳定的值,并由此制作出关于这个主题的博客排名。根据这个主题博客排名,进一步识别主题专家博客,使得博客在主题相关性,纯粹性,内聚性等方面得到了很大提高。 | ||
搜索关键词: | 基于 博客 主题 专家 识别 算法 | ||
【主权项】:
一种基于博客的主题专家识别算法,得出所有博客关于某个主题的主题质量分,将所有博客按照主题质量分的高低进行排序,其特征在于,将博客中的所有评论分为四类,分别为:第一类评论:针对其他博客博文的评论,并且同时与当前主题相关;第二类评论:针对自己博客博文的评论,并且同时与当前主题相关;第三类评论:针对其他博客博文的评论,并且与当前主题无关;第四类评论:针对自己博客博文的评论,并且与当前主题无关,则对于任意一个博客bi,其主题质量分的计算包括以下步骤:将博客bi的主题质量分分为固定质量分FixedQS(bi)和可变质量分MutableQS(bi),则有:FixedQS(bi)=PQS(bi)+CQS(bi)=wpΣj=1ndqs(pij)+wc(Σl=1m1dqs(cil)+Σj=1m2dqs(cij))---(1)]]>在公式(1)中,PQS(bi)表示博客bi中博文的质量分,CQS(bi)表示博客bi中评论的质量分,dps(pij)表示博客bi中第j条博文的质量分,dps(cil)表示博客bi中第一类评论中的第l条评论的质量分,dps(cij)表示博客bi中第二类评论中的第j条评论的质量分,n表示博客bi中博文的总数,m1表示博客bi中第一类评论的总数,m2表示博客bi中第二类评论的总数,wp、wc分别为权重分配因子;MutableQS(bi)=FixedQS(bi)+FameCQS(bi)=wpΣj=1ndqs(pij)+wc(Σl=1m1dqs(cil)+Σj=1m2dqs(cij))+wcfΣm=1m3fame_qs(cim)---(2)]]>在公式(2)中,FameCQS(bi)表示博客bi中评论的虚拟质量分,fame_qs(cim)表示博客bi中第三类评论中的第m条评论的虚拟质量分,fame_sim表示虚拟相似度,length(cim)表示第三类评论中的第m条评论的长度,m3表示博客bi所有博文获取他人第三类评论的总数量,wcf为权重分配因子;对于可变质量分MutableQS(bi),同时有公式(3):MutableQS(bi)=Σk=1commenter_count(bi)(MutableQS(bk)×Σr=1num(ck_on_bi)ratio(ckr))---(3)]]>commenter_count(bi)表示对博客bi做出评论的所有评论者的数目,MutableQS(bk)表示对博客bi做出评论的所有评论者中第k个评论者的可变质量分,num(ck_on_bi)表示对博客bi做出评论的所有评论者中第k个评论者对博客bi做出评论的总数,dps(ckr)表示对博客bi做出评论的所有评论者中第k个评论者的博客中第一类评论及第二类评论中的第r条评论的质量分,fame_qs(ckr)表示对博客bi做出评论的所有评论者中第k个评论者的博客中第三类评论中的第r条评论的虚拟质量分,Total_CQS(bk)表示对博客bi做出评论的所有评论者中第k个评论者的博客中所有第一类评论的质量分、第二类评论的质量分及第三类评论的虚拟质量分的和,sim(ckr)表示对博客bi做出评论的所有评论者中第k个评论者的博客中第r条评论与当前主题的相关度;根据公式(2)及公式(3)循环迭代计算博客bi的可变质量分MutableQS(bi)直至收敛于稳定的值,得到最终的可变质量分MutableQS(bi),并将其与固定质量分FixedQS(bi)求和,得到博客bi的主题质量分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电机学院,未经上海电机学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611085285.9/,转载请声明来源钻瓜专利网。