[发明专利]基于博客的主题专家识别算法在审

专利信息
申请号: 201611085285.9 申请日: 2016-11-30
公开(公告)号: CN106600431A 公开(公告)日: 2017-04-26
发明(设计)人: 李宇佳 申请(专利权)人: 上海电机学院
主分类号: G06Q50/00 分类号: G06Q50/00;G06F17/30
代理公司: 上海申汇专利代理有限公司31001 代理人: 翁若莹,柏子雵
地址: 201100 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 博客 主题 专家 识别 算法
【权利要求书】:

1.一种基于博客的主题专家识别算法,得出所有博客关于某个主题的主题质量分,将所有博客按照主题质量分的高低进行排序,其特征在于,

将博客中的所有评论分为四类,分别为:

第一类评论:针对其他博客博文的评论,并且同时与当前主题相关;

第二类评论:针对自己博客博文的评论,并且同时与当前主题相关;

第三类评论:针对其他博客博文的评论,并且与当前主题无关;

第四类评论:针对自己博客博文的评论,并且与当前主题无关,则对于任意一个博客bi,其主题质量分的计算包括以下步骤:

将博客bi的主题质量分分为固定质量分FixedQS(bi)和可变质量分MutableQS(bi),则有:

<mrow><mtable><mtr><mtd><mrow><mi>F</mi><mi>i</mi><mi>x</mi><mi>e</mi><mi>d</mi><mi>Q</mi><mi>S</mi><mrow><mo>(</mo><msub><mi>b</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>P</mi><mi>Q</mi><mi>S</mi><mrow><mo>(</mo><msub><mi>b</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>C</mi><mi>Q</mi><mi>S</mi><mrow><mo>(</mo><msub><mi>b</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mo>=</mo><msub><mi>w</mi><mi>p</mi></msub><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mi>d</mi><mi>q</mi><mi>s</mi><mrow><mo>(</mo><msub><mi>p</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mo>+</mo><msub><mi>w</mi><mi>c</mi></msub><mrow><mo>(</mo><munderover><mo>&Sigma;</mo><mrow><mi>l</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>m</mi><mn>1</mn></msub></munderover><mi>d</mi><mi>q</mi><mi>s</mi><mo>(</mo><msub><mi>c</mi><mrow><mi>i</mi><mi>l</mi></mrow></msub><mo>)</mo><mo>+</mo><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>m</mi><mn>2</mn></msub></munderover><mi>d</mi><mi>q</mi><mi>s</mi><mo>(</mo><msub><mi>c</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo><mo>)</mo></mrow></mrow></mtd></mtr></mtable><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>

在公式(1)中,PQS(bi)表示博客bi中博文的质量分,CQS(bi)表示博客bi中评论的质量分,dps(pij)表示博客bi中第j条博文的质量分,dps(cil)表示博客bi中第一类评论中的第l条评论的质量分,dps(cij)表示博客bi中第二类评论中的第j条评论的质量分,n表示博客bi中博文的总数,m1表示博客bi中第一类评论的总数,m2表示博客bi中第二类评论的总数,wp、wc分别为权重分配因子;

<mrow><mtable><mtr><mtd><mrow><mi>M</mi><mi>u</mi><mi>t</mi><mi>a</mi><mi>b</mi><mi>l</mi><mi>e</mi><mi>Q</mi><mi>S</mi><mrow><mo>(</mo><msub><mi>b</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mo>=</mo><mi>F</mi><mi>i</mi><mi>x</mi><mi>e</mi><mi>d</mi><mi>Q</mi><mi>S</mi><mrow><mo>(</mo><msub><mi>b</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>F</mi><mi>a</mi><mi>m</mi><mi>e</mi><mi>C</mi><mi>Q</mi><mi>S</mi><mrow><mo>(</mo><msub><mi>b</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mo>=</mo><msub><mi>w</mi><mi>p</mi></msub><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mi>d</mi><mi>q</mi><mi>s</mi><mrow><mo>(</mo><msub><mi>p</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mo>+</mo><msub><mi>w</mi><mi>c</mi></msub><mrow><mo>(</mo><munderover><mo>&Sigma;</mo><mrow><mi>l</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>m</mi><mn>1</mn></msub></munderover><mi>d</mi><mi>q</mi><mi>s</mi><mo>(</mo><msub><mi>c</mi><mrow><mi>i</mi><mi>l</mi></mrow></msub><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mo>+</mo><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>m</mi><mn>2</mn></msub></munderover><mi>d</mi><mi>q</mi><mi>s</mi><mrow><mo>(</mo><msub><mi>c</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mo>)</mo><mo>+</mo><msub><mi>w</mi><mrow><mi>c</mi><mi>f</mi></mrow></msub><munderover><mo>&Sigma;</mo><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>m</mi><mn>3</mn></msub></munderover><mi>f</mi><mi>a</mi><mi>m</mi><mi>e</mi><mo>_</mo><mi>q</mi><mi>s</mi><mrow><mo>(</mo><msub><mi>c</mi><mrow><mi>i</mi><mi>m</mi></mrow></msub><mo>)</mo></mrow></mrow></mtd></mtr></mtable><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>

在公式(2)中,FameCQS(bi)表示博客bi中评论的虚拟质量分,fame_qs(cim)表示博客bi中第三类评论中的第m条评论的虚拟质量分,fame_sim表示虚拟相似度,length(cim)表示第三类评论中的第m条评论的长度,m3表示博客bi所有博文获取他人第三类评论的总数量,wcf为权重分配因子;

对于可变质量分MutableQS(bi),同时有公式(3):

<mrow><mi>M</mi><mi>u</mi><mi>t</mi><mi>a</mi><mi>b</mi><mi>l</mi><mi>e</mi><mi>Q</mi><mi>S</mi><mrow><mo>(</mo><msub><mi>b</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>c</mi><mi>o</mi><mi>m</mi><mi>m</mi><mi>e</mi><mi>n</mi><mi>t</mi><mi>e</mi><mi>r</mi><mo>_</mo><mi>c</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>b</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></munderover><mrow><mo>(</mo><mi>M</mi><mi>u</mi><mi>t</mi><mi>a</mi><mi>b</mi><mi>l</mi><mi>e</mi><mi>Q</mi><mi>S</mi><mo>(</mo><msub><mi>b</mi><mi>k</mi></msub><mo>)</mo><mo>&times;</mo><munderover><mo>&Sigma;</mo><mrow><mi>r</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>n</mi><mi>u</mi><mi>m</mi><mrow><mo>(</mo><msub><mi>c</mi><mi>k</mi></msub><mo>_</mo><mi>o</mi><mi>n</mi><mo>_</mo><msub><mi>b</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></munderover><mi>r</mi><mi>a</mi><mi>t</mi><mi>i</mi><mi>o</mi><mo>(</mo><msub><mi>c</mi><mrow><mi>k</mi><mi>r</mi></mrow></msub><mo>)</mo><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>

commenter_count(bi)表示对博客bi做出评论的所有评论者的数目,MutableQS(bk)表示对博客bi做出评论的所有评论者中第k个评论者的可变质量分,num(ck_on_bi)表示对博客bi做出评论的所有评论者中第k个评论者对博客bi做出评论的总数,dps(ckr)表示对博客bi做出评论的所有评论者中第k个评论者的博客中第一类评论及第二类评论中的第r条评论的质量分,fame_qs(ckr)表示对博客bi做出评论的所有评论者中第k个评论者的博客中第三类评论中的第r条评论的虚拟质量分,Total_CQS(bk)表示对博客bi做出评论的所有评论者中第k个评论者的博客中所有第一类评论的质量分、第二类评论的质量分及第三类评论的虚拟质量分的和,sim(ckr)表示对博客bi做出评论的所有评论者中第k个评论者的博客中第r条评论与当前主题的相关度;

根据公式(2)及公式(3)循环迭代计算博客bi的可变质量分MutableQS(bi)直至收敛于稳定的值,得到最终的可变质量分MutableQS(bi),并将其与固定质量分FixedQS(bi)求和,得到博客bi的主题质量分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电机学院,未经上海电机学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611085285.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top