[发明专利]一种融合成对约束和关键词的半监督文本聚类方法及装置无效
申请号: | 201010247627.9 | 申请日: | 2010-08-01 |
公开(公告)号: | CN102346753A | 公开(公告)日: | 2012-02-08 |
发明(设计)人: | 王金龙;吴舜尧;李刚 | 申请(专利权)人: | 青岛理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266033 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种融合成对约束和关键词的半监督文本聚类方法及装置。本发明的方法包括:融合成对约束辅助文本聚类并得到初始特征词权重;基于所获得的初始特征词权重,同时融合成对约束和关键词进行半监督聚类;依据用户满意度评估并选择聚类结果。本发明的装置包括预处理模块、融合成对约束的文本聚类模块、融合成对约束和关键词两种信息的半监督文本聚类模块和评价及选择结果模块。由于本发明所提供的半监督文本聚类方法在融合成对约束信息的基础上,继续添加关键词信息,在运用成对约束学习特征词权重的同时,利用关键词信息对相应的特征词权重进行调整,使两种先验信息相互影响,相互促进,所以可获得更准确的聚类结果。 | ||
搜索关键词: | 一种 融合 成对 约束 关键词 监督 文本 方法 装置 | ||
【主权项】:
一种融合成对约束和关键词的半监督文本聚类方法及装置,其特征在于,该方法及装置包括以下步骤:A、利用融合成对约束的半监督文本聚类方法对文本数据集进行划分,并得到初始特征词权重;B、基于初始特征词权重,同时融合成对约束和关键词两种信息对文本数据集进行聚类划分;C、以用户满意度为指标,评价所产生的文本划分的质量,并选择质量高的聚类结果输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛理工大学,未经青岛理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010247627.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种树脂切割砂轮及其制备方法
- 下一篇:自发电计算机冷却系统