[发明专利]基于聚类/分类和时间的簇页面排名设备和方法有效
申请号: | 200910176845.5 | 申请日: | 2009-09-22 |
公开(公告)号: | CN102023993A | 公开(公告)日: | 2011-04-20 |
发明(设计)人: | 游赣梅;王晓萌;陈义;赵利军;郑继川 | 申请(专利权)人: | 株式会社理光 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 黄小临 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分类 时间 页面 排名 设备 方法 | ||
1.一种基于聚类/分类和时间的簇页面排名设备,包括:
搜索器,被配置以接收用户给定的查询语句,根据所述查询语句从数据集中搜索相关文档并计算所搜索文档的文档相关值,从而得到排序的相关文档集,并将所述相关文档集输出;
簇生成器,被配置以接收从所述搜索器输出的相关文档集,对所述相关文档集进行聚类或分类从而得到簇,并将所述簇输出;
基于时间的簇页面排名计算器,被配置以从所述簇生成器接收所输出的簇,基于簇计算基于时间的簇页面排名值,并输出所述基于时间的簇页面排名值,所述基于时间的簇页面排名值是所述簇中所有文档的基于时间的文档链接值的组合,并作为所述簇中所有文档的基于时间的页面排名值、基于时间的作者排名值和基于时间的文档库排名值的组合;
簇趋势生成器,被配置以从所述基于时间的簇页面排名计算器接收所述基于时间的簇页面排名值,并根据所述基于时间的簇页面排名值计算簇的未来的基于时间的簇页面排名值,并输出所述未来的基于时间的簇页面排名值;和
簇趋势排名器,被配置以从簇趋势生成器接收所述未来的基于时间的簇页面排名值,并对所述未来的基于时间的簇页面排名值进行排序从而得到趋势。
2.如权利要求1所述的设备,其中,所述基于时间的簇页面排名计算器进一步包括:
页面排名值计算单元,被配置以计算簇中文档的基于时间的页面排名值;
作者排名值计算单元,被配置以计算簇中文档的基于时间的作者排名值;
文档库排名值计算单元,被配置以计算簇中文档的基于时间的文档库排名值;和
加权单元,通过计算来自所述页面排名值计算单元的基于时间的页面排名值、来自所述作者排名值计算单元的基于时间的作者排名值和来自所述文档库排名值计算单元的基于时间的文档库排名值的加权和,并累积簇中所有文档的加权和来产生所述基于时间的簇页面排名值。
3.如权利要求2所述的设备,其中,所述页面排名值计算单元通过在所有时间Ti的文档的基于时间的页面排名变化值的加权和来计算该文档在时间Tn的基于时间的页面排名值,其中i=1,...,n,Ti≤Tn,且所述在所有时间Ti的文档的基于时间的页面排名变化值的权重是时间Ti到Tn的时间差的老化函数,并且在时间Ti的文档的基于时间的页面排名变化值是所有指向该文档的文档在时间Ti的基于时间的页面排名变化值的加权和,且所述所有指向该文档的文档在时间Ti的基于时间的页面排名变化值的权重与所述搜索器得到的文档相关值成正比。
4.如权利要求2所述的设备,其中,所述作者排名值计算单元所计算的文档的基于时间的作者排名值是此文档所有作者的基于时间的作者排名值之和,其中,通过在所有时间Ti的作者的基于时间的作者排名变化值的加权和来计算该作者在时间Tn的基于时间的作者排名值,其中i=1,...n,Ti≤Tn,且所述在所有时间Ti的作者的基于时间的作者排名变化值的权重是时间Ti到Tn的时间差的老化函数,并且在时间Ti的作者的基于时间的作者排名值为该作者所写的所有指向该文档的文档在时间Ti的基于时间的页面排名变化值的加权和,所述作者所写的所有指向该文档的文档在时间Ti的基于时间的页面排名变化值的权重与所述搜索器得到的文档相关值成正比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910176845.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:医疗用X射线摄像系统
- 下一篇:一种信息检索方法及其系统