[发明专利]话题演化分析的方法及装置有效
申请号: | 201510681161.6 | 申请日: | 2015-10-19 |
公开(公告)号: | CN106599002B | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 朱波 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 话题 演化 分析 方法 装置 | ||
本发明公开了一种话题演化分析的方法及装置,涉及互联网技术领域,为解决现有技术中话题分析人员无法获得更有价值的信息而发明。本发明的方法包括:将同一话题的网络内容按照内容产生的时间归类到不同的时间窗口中;通过话题模型分别分析每个时间窗口中网络内容涉及的子话题;对每个时间窗口中的子话题分别进行情感分析,获取子话题在所属时间窗口中的情感值;将相邻时间窗口中相同的子话题进行关联;根据同一子话题在不同时间窗口中的情感值,生成子话题在时间维度上的情感趋势变化。本发明适合应用在对舆情话题的演化分析的过程中。
技术领域
本发明涉及互联网技术领域,尤其涉及一种话题演化分析的方法及装置。
背景技术
随着互联网技术的普及,大家对某话题的评论和观点开始更多的通过网络进行发布,比如微博,贴吧等。为了更好的分析某话题的发展,通常会建立话题模型,对某个媒体中某话题的相关评论和观点的文本进行时序分析,找出话题演化的历程,即找出文本数据中包含的话题内容和具体话题的情感历时变化,以及某话题的关注度随时间的变化,关注度反映的是对话题评论的数量随时间的变化,对话题的评论数量越多,表明对话题的关注度越高。
在上述分析话题发展的过程中,发明人发现,现有技术中对话题演化历程的分析仅限于对话题内容以及话题评论的数量的分析,分析指标单一,分析人员无法从中获得更有价值的信息。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种话题演化分析的方法及装置。
为解决上述技术问题,一方面,本发明提供了一种话题演化分析的方法,该方法包括:
将同一话题的网络内容按照内容产生的时间归类到不同的时间窗口中;
通过话题模型分别分析每个时间窗口中网络内容涉及的子话题;
对每个时间窗口中的子话题分别进行情感分析,获取所述子话题在所属时间窗口中的情感值;
将相邻时间窗口中相同的子话题进行关联;
根据同一子话题在不同时间窗口中的情感值,生成所述子话题在时间维度上的情感趋势变化。
另一方面,本发明还提供了一种话题演化分析的装置,该装置包括:
归类单元,用于将同一话题的网络内容按照内容产生的时间归类到不同的时间窗口中;
第一分析单元,用于通过话题模型分别分析所述归类单元归类得到的每个时间窗口中网络内容涉及的子话题;
第二分析单元,用于对所述第一分析单元分析得到的所述每个时间窗口中的子话题分别进行情感分析,获取所述子话题在所属时间窗口中的情感值;
关联单元,用于将所述第一分析单元分析得到的相邻时间窗口中相同的子话题进行关联;
生成单元,用于根据所述第二分析单元对所述关联单元关联得到的同一子话题在不同时间窗口中的情感值,生成所述子话题在时间维度上的情感趋势变化。
借由上述技术方案,本发明提供的话题演化分析的方法及装置,能够将同一话题内容按时间归类到不同的时间窗口中,然后通过话题模型分析得到每个时间窗口中的子话题,并获取每个时间窗口中的子话题的情感值,最后将相邻时间窗口中的同一子话题进行关联,得到同一子话题随时间变化的情感趋势的变化。与现有技术相比,本发明能够得到同一子话题的情感趋势变化,给出该子话题在时序上的关注度趋势变化,能够提供更有价值的话题分析信息。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510681161.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网页内容获取方法和系统
- 下一篇:一种基于汇编的嵌入式Web服务器设计的方法