[发明专利]一种并行主题挖掘方法及装置有效
申请号: | 201410062523.9 | 申请日: | 2014-02-24 |
公开(公告)号: | CN104866491B | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 曾嘉;倪冰;陈嘉 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/30 | 分类号: | G06F16/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种并行主题挖掘方法及装置。该方法包括:并行主题挖掘装置中的第一节点接收第二节点发送的第二单词‑主题子矩阵和第二余数子矩阵;其中,第二余数子矩阵包括余数矩阵中行累加值最大的行以及列累加值最大的列,所述第二单词‑主题子矩阵包括所述余数矩阵中行累加值最大的行的行号在单词‑主题矩阵中对应的行,以及所述余数矩阵中列累加值最大的列的列号在所述单词‑主题矩阵中对应的列;并根据第二单词‑主题子矩阵更新第一单词‑主题子矩阵,根据第二余数子矩阵更新第一余数子矩阵,将更新后的第一单词‑主题子矩阵和第一余数子矩阵发送至第二节点。从而减小主题挖掘过程中的通讯量,提高主题挖掘的速度。 | ||
搜索关键词: | 一种 并行 主题 挖掘 方法 装置 | ||
【主权项】:
1.一种并行主题挖掘方法,其特征在于,包括:并行主题挖掘装置中的第一节点接收所述并行主题挖掘装置中的第二节点发送的第二单词‑主题子矩阵和第二余数子矩阵;其中,所述第二余数子矩阵包括余数矩阵中行累加值最大的行以及列累加值最大的列,所述第二单词‑主题子矩阵包括所述余数矩阵中行累加值最大的行的行号在单词‑主题矩阵中对应的行,以及所述余数矩阵中列累加值最大的列的列号在所述单词‑主题矩阵中对应的列;所述余数矩阵用于指示主题索引以及单词索引所对应的余数值;所述第一节点根据所述第二单词‑主题子矩阵更新第一单词‑主题子矩阵,根据所述第二余数子矩阵更新第一余数子矩阵,并将更新后的第一单词‑主题子矩阵和更新后的第一余数子矩阵发送至所述第二节点,以使所述第二节点将至少两个第一节点发送的至少两个第一单词‑主题子矩阵合并成单词‑主题矩阵,将所述至少两个第一节点发送的至少两个第一余数子矩阵合并成余数矩阵,并将获取的所述第二余数子矩阵和所述第二单词‑主题子矩阵均发送到至少两个所述第一节点;其中,所述余数矩阵用于指示主题索引以及单词索引所对应的余数值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410062523.9/,转载请声明来源钻瓜专利网。
- 上一篇:确定词素重要性分析模型的方法及装置
- 下一篇:一种宽表刷新的方法和装置