[发明专利]话题演化分析的方法及装置有效
申请号: | 201510681161.6 | 申请日: | 2015-10-19 |
公开(公告)号: | CN106599002B | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 朱波 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 话题 演化 分析 方法 装置 | ||
1.一种话题演化分析的方法,其特征在于,所述方法包括:
将同一话题的网络内容按照内容产生的时间归类到不同的时间窗口中;
通过话题模型分别分析每个时间窗口中网络内容涉及的子话题;
对每个时间窗口中的子话题分别进行情感分析,获取所述子话题在所属时间窗口中的情感值;
将相邻时间窗口中相同的子话题进行关联;
根据同一子话题在不同时间窗口中的情感值,生成所述子话题在时间维度上的情感趋势变化;
在所述按照内容产生的时间将同一话题的网络内容归类到不同的时间窗口中之前,所述方法进一步包括:
根据时间及其对应所述网络内容的数量,得到关于时间和所述网络内容的数量的曲线;
将所述曲线中每一个波峰对应的时刻作为一个时间窗口的节点;
将相邻两个节点之间的时间长度设置为一个时间窗口的长度。
2.根据权利要求1所述的方法,其特征在于,所述将所述曲线中每一个波峰对应的时刻作为一个时间窗口的节点,包括:
当新增所述话题的网络内容时,按照新增网络内容的数量确定新的节点;
所述将相邻两个节点之间的时间长度设置为一个时间窗口的长度,包括:
将所述新的节点与其前一节点之间的时间长度设置为一个新的时间窗口的长度;
所述按照内容产生的时间将同一话题的网络内容归类到不同的时间窗口中,包括:
将所述新增网络内容归类到所述新的时间窗口中。
3.根据权利要求1所述的方法,其特征在于,所述对每个时间窗口中的子话题分别进行情感分析,获取所述子话题在所属时间窗口中的情感值,包括:
在预设的情感词字典中查找所述子话题中包含的情感词对应的情感值;
将所述情感词的情感值相加,获得所述子话题在所属时间窗口中的情感值。
4.根据权利要求1所述的方法,其特征在于,所述将相邻时间窗口中相同的子话题进行关联,包括:
通过话题模型分别获取相邻时间窗口中子话题中的话题词;
计算相邻窗口中子话题的话题词之间的相似度值;
将相似度值满足预设阈值的话题词所分别对应的子话题,按照各自所在的时间窗口的先后顺序进行关联。
5.根据权利要求3所述的方法,其特征在于,所述情感值的正负用于表征所述情感词为积极情感词或消极情感词;
所述情感值的大小用于表征所述情感词的情感强度。
6.一种话题演化分析的装置,其特征在于,所述装置包括:
归类单元,用于将同一话题的网络内容按照内容产生的时间归类到不同的时间窗口中;
第一分析单元,用于通过话题模型分别分析所述归类单元归类得到的每个时间窗口中网络内容涉及的子话题;
第二分析单元,用于对所述第一分析单元分析得到的所述每个时间窗口中的子话题分别进行情感分析,获取所述子话题在所属时间窗口中的情感值;
关联单元,用于将所述第一分析单元分析得到的相邻时间窗口中相同的子话题进行关联;
生成单元,用于根据所述第二分析单元对所述关联单元关联得到的同一子话题在不同时间窗口中的情感值,生成所述子话题在时间维度上的情感趋势变化;
所述装置进一步包括:
确定单元,用于根据时间及其对应所述网络内容的数量,得到关于时间和所述网络内容的数量的曲线,以及将所述曲线中每一个波峰对应的时刻作为一个时间窗口的节点;
设置单元,用于将所述确定单元确定的相邻两个节点之间的时间长度设置为一个时间窗口的长度。
7.根据权利要求6所述的装置,其特征在于,所述第二分析单元,包括:
查找模块,用于在预设的情感词字典中查找所述子话题中包含的情感词对应的情感值;
相加模块,用于将所述查找模块查找的所述情感词的情感值相加,获得所述子话题在所属时间窗口中的情感值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510681161.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:网页内容获取方法和系统
- 下一篇:一种基于汇编的嵌入式Web服务器设计的方法