[发明专利]热点话题生成方法、装置、计算机设备和存储介质有效
申请号: | 201910572440.7 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110413994B | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 柴志伟;丑晓慧 | 申请(专利权)人: | 宁波深擎信息科技有限公司;上海深擎信息科技有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/35;G06F16/36 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 邱轶 |
地址: | 315000 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及一种热点话题生成方法、装置、计算机设备和存储介质。所述方法包括:基于文本库中的文章数据,采用图谱描述文章数据,根据预先设置的特征标签与特征词的映射表,对图谱中的节点进行匹配,得到正文分词对应的特征标签以及特征标签的相关得分,根据相关得分,确定文章数据的特征词集合,根据特征词集合和摘要部分的摘要分词,建立文章数据的词集,将文本库中的文章数据的词集输入预先设置的聚类算法中,得到词集中的单词与预先设置的话题类的第一分布以及文章数据与话题类的第二分布,根据第一分布,生成各个话题类的话题词,根据第二分布以及所述话题词,生成各个话题类的话题标题。采用本方法能够快速生成热点话题。 | ||
搜索关键词: | 热点话题 生成 方法 装置 计算机 设备 存储 介质 | ||
【主权项】:
1.一种热点话题生成方法,所述方法包括:基于文本库中的文章数据,采用图谱描述所述文章数据;所述文章数据包括:摘要部分和正文部分;所述图谱中的每一个节点表示所述正文部分中的一个正文分词;根据预先设置的特征标签与特征词的映射表,对所述图谱中的节点进行匹配,得到所述正文分词对应的特征标签以及所述特征标签的相关得分,根据所述相关得分,确定所述文章数据的特征词集合;根据所述特征词集合和所述摘要部分的摘要分词,建立所述文章数据的词集,将文本库中的文章数据的所述词集输入预先设置的聚类算法中,得到所述词集中的单词与预先设置的话题类的第一分布以及所述文章数据与所述话题类的第二分布;根据所述第一分布,生成各个话题类的话题词,根据所述第二分布以及所述话题词,生成各个话题类的话题标题。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波深擎信息科技有限公司;上海深擎信息科技有限公司,未经宁波深擎信息科技有限公司;上海深擎信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910572440.7/,转载请声明来源钻瓜专利网。