[发明专利]热点话题检测方法及装置有效
申请号: | 201811260532.3 | 申请日: | 2018-10-26 |
公开(公告)号: | CN109582783B | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 徐常胜;方全;李泳锡 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/34;G06F16/36 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及计算机技术领域,具体涉及一种热点话题检测方法。本发明的热点话题检测方法包括:基于预设实体知识库提取目标文本的关键句作为目标文本的摘要;使用LSH算法计算摘要的文档指纹;基于KNN算法对文档指纹进行聚类分析以确定目标文本的话题类别。本发明的热点话题检测方法是基于实体知识库中的实体对目标文本的句子进行评估,根据评估结果提取目标文本关键句作为摘要,通过这种方式可以使得提取出的摘要能够与具体应用场景紧密结合的同时还能保留更多的话题信息,进而保证后续文档聚类的精度,实现高质量的话题检测功能。 | ||
搜索关键词: | 热点话题 检测 方法 装置 | ||
【主权项】:
1.一种热点话题检测方法,其特征在于,所述方法包括:基于预设实体知识库提取目标文本的关键句作为所述目标文本的摘要;使用LSH算法计算所述摘要的文档指纹;基于KNN算法对所述文档指纹进行聚类分析以确定所述目标文本的话题类别;其中,所述预设实体知识库是基于知识图谱结构构建的知识库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811260532.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于用弱监督深度学习的文本聚类方法
- 下一篇:文本分类方法及装置