[发明专利]基于社团发现的主题模型构建方法有效
申请号: | 201710361414.0 | 申请日: | 2017-05-22 |
公开(公告)号: | CN107122494B | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 张雷;赵鑫;宋岳;李宁 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06Q50/00 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于社团发现的主题模型构建的方法的技术方案,先后包括如下步骤:基于短文本数据提取蕴含的关系网络;采用社团发现算法将关系网络划分成多个社团;将各社团中提取的短文本进行扩充以得到具有词共现关系的长文档,并将得到的多个长文档构成长文档集合;针对长文档集合进行主题挖掘,得到基于社团发现的TMCD主题模型。该方法从数据中内在蕴含的社团关系的角度出发,以社团发现算法为基础进行短文本的自扩展,解决了数据稀疏性问题。 | ||
搜索关键词: | 基于 社团 发现 主题 模型 构建 方法 | ||
【主权项】:
一种基于社团发现的主题模型构建方法,其特征在于,包括如下步骤:步骤1、基于短文本数据提取蕴含的关系网络;步骤2、采用社团发现算法将关系网络划分成多个社团;步骤3、将各社团中提取的短文本进行扩充以得到具有词共现关系的长文档,并将得到的多个长文档构成长文档集合;步骤4、针对长文档集合进行主题挖掘,得到基于社团发现的TMCD主题模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710361414.0/,转载请声明来源钻瓜专利网。
- 上一篇:歌曲播放方法和装置
- 下一篇:适用于专利公开科技数据库的信息抓取方法