[发明专利]一种基于平滑短语主题模型的主题提取方法及装置有效
申请号: | 201911421842.3 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111178048B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 郭佳;张景鹏;徐路;李油;赵小琦 | 申请(专利权)人: | 微梦创科网络科技(中国)有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/289;G06F16/2458 |
代理公司: | 北京卓岚智财知识产权代理有限公司 11624 | 代理人: | 蔡永波 |
地址: | 100193 北京市海淀区东北旺西路中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种基于平滑短语主题模型的主题提取方法及装置,包括:提取待处理数据集内的有效词,得到预处理数据集;通过Apriori关联算法自预处理数据集中提取出频繁短语,形成频繁短语数据集;根据频繁短语出现频率的高斯分布特性,将预处理数据集中符合预设要求的相邻的频繁短语组合成新的短语,并将新的短语加入到频繁短语数据集,形成候选短语数据集;通过SPLDA平滑短语主题模型对候选短语数据集进行分析,得到主题短语,通过主题短语形成相应的话题。通过平滑短语主题模型对候选短语数据集进行分析得到主题短语,通过主题短语形成相应的话题,提高了话题的可读性,更准确地表述了话题的真实信息。 | ||
搜索关键词: | 一种 基于 平滑 短语 主题 模型 提取 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911421842.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种时序数据的压缩方法、装置以及设备
- 下一篇:一种路灯灯具标识采集系统