[发明专利]一种联合行为-情感-时序的在线论坛主题建模方法在审
申请号: | 202111209018.9 | 申请日: | 2021-10-18 |
公开(公告)号: | CN113934846A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 张思;陈娟;夏丹;高倩倩 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/36 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联合 行为 情感 时序 在线 论坛 主题 建模 方法 | ||
本发明公开了一种联合行为‑情感‑时序的在线论坛主题建模方法。包括对个人的发帖文本进行情感、行为、主题和时间挖掘。首先,针对帖子和个人情感确定帖子的情感向量占比;依据相关行为分类规则获取行为向量占比;将情感向量与行为向量联合,获取多类别的情感‑行为分类;依据情感‑行为分类的概率,确定在不同分类下的主题分布;联合时间向量,获取不同情感、不同行为、不同主题,在不同时间发帖的概率;联合主题下的词向量,确定不同情感、不同行为、不同主题中所选词的概率变化;最后,综合上述所有概率,得到个人所发帖子的情感、行为、时间和主题占比。本发明可以获得个人在不同阶段所关注的兴趣主题以及个人行为的演化趋势。
技术领域
本发明涉及文本数据挖掘技术领域,尤其涉及一种联合行为-情感-时序的在线论坛主题建模方法。
背景技术
身处于一个信息爆炸的时代,如何从海量信息中发现和抽取自己真正需要的信息和数据成为一个很大的难题。数据挖掘技术应运而生。相较于复杂的图片和音视频、动画资源,文本挖掘既获取简单,分析和处理便捷,也能准确地表达个人的真实观点和意见。通过对在线论坛中大量的帖子文本进行深入挖掘和分析,能更好地了解和掌握个人的兴趣偏好和行为倾向,对于精准的知识推送服务有着很大的帮助。而借助帖子文本对论坛中个人潜在的情感和行为倾向进行探究已经成为大数据时代研究者们的重点关注问题。
学者们试图通过构建模型对已有数据进行集成和算法训练,达到对个人乃至某一集体发布的未知帖子文本的情感和行为的推断和评估。但对于情感和行为二者联合后进行分析和评价的相关研究较少,个人在某种情感下实施某种行为的概率有多大,这个概率随时间变化和演化情况如何,这些方面还存在很多不足。也就是说,现有的方法无法获得在线论坛中的深层次的信息。
发明内容
本发明提出一种联合行为-情感-时序的在线论坛主题建模方法,用于解决或者至少部分解决现有技术的方法无法获取在线论坛中深层次信息的技术问题。
为了解决上述技术问题,本发明提供了一种联合行为-情感-时序的在线论坛主题建模方法,包括:
S1:根据学习者发帖的需要,结合预设情感分类规则,确定帖子中各类情感占比;
S2:根据学习者发帖的需要,结合预设行为分类规则,确定帖子中各类行为占比;
S3:联合各类情感占比和各类行为占比,获取多类别的情感-行为分类;基于多类别的情感-行为分类以及主题向量,确定在不同情感,不同行为下的主题分布情况;
S4:基于在不同情感,不同行为下的主题分布情况,联合时间向量,获取不同情感、不同行为、不同主题,在不同时间发帖的概率;
S5:基于在不同情感,不同行为下的主题分布情况,联合主题下的词向量,确定不同情感、不同行为、不同主题中的词分布情况;
S6:根据各类情感占比、各类行为占比、不同情感、不同行为、不同主题,在不同时间发帖的概率以及不同情感、不同行为、不同主题中的词分布情况,构建联合行为-情感-时序的主题模型。
在一种实施方式中,步骤S1包括:
S1.1:构建情感词典,得到预设情感分类规则;
S1.2:根据情感词典中的预设情感分类规则计算各类情感占比,计算公式为:
其中,表示在情感种类词向量中选择特定情感的概率,即帖子中各类情感占比,表示迪利克雷分布,表示在这篇文档中选择这类情感的概率,表示情感向量;γ是超参数,表示情感词向量的稀疏度,表示情感词向量的稀疏度向量,π表示文档中的情感概率分布;m表示文档数,M表示全部文档数;j表示情感种类,E表示全部情感种类数目;表示第m篇文档中第j种情感所有的词数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111209018.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于拆装携带的远距电子标识
- 下一篇:用于输出信息的方法和装置