[发明专利]一种融合多种语言文献的聚类机制有效
申请号: | 201310416693.8 | 申请日: | 2013-09-12 |
公开(公告)号: | CN103455623A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 袁子牧;彭澎;季统凯;岳强 | 申请(专利权)人: | 广东电子工业研究院有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 523808 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及信息检索技术领域,特别涉及一种融合多种语言文献的聚类机制。本发明按如下步骤进行:步骤1,建立包含多种语言词汇的近义词库;步骤2,提取8种特征值;步骤3,根据特征值,计算任意两篇文献i和j的相似度;步骤4,在文献集合中选择聚点,建立聚类;步骤5,将文献集合中剩余的文献加入到聚类之中;步骤6,将聚类置于圆环结构之中。本发明不限定聚类机制中文献语言的类别,依据相似度判断从文献中选择聚点并建立聚类,将不同语言的文献归于聚类之中;可用于多种语言文献的聚类中。 | ||
搜索关键词: | 一种 融合 多种 语言 文献 机制 | ||
【主权项】:
一种融合多种语言文献的聚类机制,其特征在于:按如下步骤进行: 步骤1,建立包含多种语言词汇的近义词库; 步骤2,提取8种特征值; 步骤3,根据特征值,计算任意两篇文献i和j的相似度; 步骤4,在文献集合中选择聚点,建立聚类; 步骤5,将文献集合中剩余的文献加入到聚类之中; 步骤6,将聚类置于圆环结构之中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电子工业研究院有限公司,未经广东电子工业研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310416693.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种用于环网柜的多通道臭氧探测仪
- 下一篇:药物活性成分筛选方法