[发明专利]可缩放群集有效
申请号: | 201080016627.6 | 申请日: | 2010-04-01 |
公开(公告)号: | CN102388382A | 公开(公告)日: | 2012-03-21 |
发明(设计)人: | A·施瓦格夫;J·Q·坎德拉;T·博彻特;T·格雷佩;R·赫布里希 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/00 | 分类号: | G06F17/00;G06F9/06;G06F9/44;G06F17/21;G06F15/16 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 蔡悦 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 描述了可缩放群集系统。在一个实施例中,群集系统可用于极大规模的应用,其中具有数千万的特征的数百万的项被群集。在一个实施例中,群集系统使用对数据集中的不确定性进行建模的概率群集模型,其中数据集可以是例如订阅关键词的广告、包含文本关键词的文本文档、具有相关联的特征的图像或其他项。在一个实施例中,群集系统被用于生成附加特征用于与给定项相关联。例如,建议广告者可能想订阅的附加关键词。在某些实施例中,所生成的附加特征具有可用于对那些特征进行排序的相关联的概率值。在某些示例中,用户对所生成的特征的返回被接收,并且用于修订特征生成过程。 | ||
搜索关键词: | 缩放 群集 | ||
【主权项】:
一种群集项的计算机实现的方法,每一项具有至少一个相关联的特征,所述方法包括:将数据结构存储在存储器中,所述数据结构保留多个群集(201);对于每一项,一个或多个相关联的特征(202);对于每一群集,与先验概率分布有关的至少一个群集成员资格参数(200),所述先验概率分布表示相信所述项中的任一个是否为该群集的成员;对于每一群集和特征组合,与先验概率分布有关的至少一个特征参数(203),所述先验概率分布表示相信该群集中的项中的任一个与该特征相关联;接收并存储包括具有观察到的相关联的特征的受观察项的输入(302);在所接收的输入的基础上并使用贝叶斯更新过程来更新(304)所述数据结构中的参数;迭代所述接收和更新多个这样的输入的步骤。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201080016627.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种塑料钩片滚压模具
- 下一篇:可变流量的流体机械