[发明专利]基于博客的主题专家识别算法在审
申请号: | 201611085285.9 | 申请日: | 2016-11-30 |
公开(公告)号: | CN106600431A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 李宇佳 | 申请(专利权)人: | 上海电机学院 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F17/30 |
代理公司: | 上海申汇专利代理有限公司31001 | 代理人: | 翁若莹,柏子雵 |
地址: | 201100 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 博客 主题 专家 识别 算法 | ||
1.一种基于博客的主题专家识别算法,得出所有博客关于某个主题的主题质量分,将所有博客按照主题质量分的高低进行排序,其特征在于,
将博客中的所有评论分为四类,分别为:
第一类评论:针对其他博客博文的评论,并且同时与当前主题相关;
第二类评论:针对自己博客博文的评论,并且同时与当前主题相关;
第三类评论:针对其他博客博文的评论,并且与当前主题无关;
第四类评论:针对自己博客博文的评论,并且与当前主题无关,则对于任意一个博客bi,其主题质量分的计算包括以下步骤:
将博客bi的主题质量分分为固定质量分FixedQS(bi)和可变质量分MutableQS(bi),则有:
在公式(1)中,PQS(bi)表示博客bi中博文的质量分,CQS(bi)表示博客bi中评论的质量分,dps(pij)表示博客bi中第j条博文的质量分,dps(cil)表示博客bi中第一类评论中的第l条评论的质量分,dps(cij)表示博客bi中第二类评论中的第j条评论的质量分,n表示博客bi中博文的总数,m1表示博客bi中第一类评论的总数,m2表示博客bi中第二类评论的总数,wp、wc分别为权重分配因子;
在公式(2)中,FameCQS(bi)表示博客bi中评论的虚拟质量分,fame_qs(cim)表示博客bi中第三类评论中的第m条评论的虚拟质量分,fame_sim表示虚拟相似度,length(cim)表示第三类评论中的第m条评论的长度,m3表示博客bi所有博文获取他人第三类评论的总数量,wcf为权重分配因子;
对于可变质量分MutableQS(bi),同时有公式(3):
commenter_count(bi)表示对博客bi做出评论的所有评论者的数目,MutableQS(bk)表示对博客bi做出评论的所有评论者中第k个评论者的可变质量分,num(ck_on_bi)表示对博客bi做出评论的所有评论者中第k个评论者对博客bi做出评论的总数,dps(ckr)表示对博客bi做出评论的所有评论者中第k个评论者的博客中第一类评论及第二类评论中的第r条评论的质量分,fame_qs(ckr)表示对博客bi做出评论的所有评论者中第k个评论者的博客中第三类评论中的第r条评论的虚拟质量分,Total_CQS(bk)表示对博客bi做出评论的所有评论者中第k个评论者的博客中所有第一类评论的质量分、第二类评论的质量分及第三类评论的虚拟质量分的和,sim(ckr)表示对博客bi做出评论的所有评论者中第k个评论者的博客中第r条评论与当前主题的相关度;
根据公式(2)及公式(3)循环迭代计算博客bi的可变质量分MutableQS(bi)直至收敛于稳定的值,得到最终的可变质量分MutableQS(bi),并将其与固定质量分FixedQS(bi)求和,得到博客bi的主题质量分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电机学院,未经上海电机学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611085285.9/1.html,转载请声明来源钻瓜专利网。