[发明专利]一种基于BLSTM的微博谣言检测方法在审
申请号: | 201711436582.8 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108280057A | 公开(公告)日: | 2018-07-13 |
发明(设计)人: | 林达真;林凯;马奔;曹冬林;陈香焰;刘秉钧 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/08 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本数据 检测 微博 预处理 矩阵 机器学习领域 微博网络数据 处理数据 分类检测 检测结果 媒体提供 训练建模 训练模型 复杂度 准确率 构建 样本 学习 | ||
1.一种基于BLSTM的微博谣言检测方法,其特征在于包括以下步骤:
1)收集微博网络数据作为样本数据;
2)对样本数据进行预处理;
3)用word2vec方法构建样本句矩阵;
4)对待检测的微博数据进行预处理;
5)根据对层次的训练模型,对待检测句矩阵进行分类检测,得到检测结果。
2.如权利要求1所述一种基于BLSTM的微博谣言检测方法,其特征在于在步骤2)中,所述预处理包括分词、去停用词、文本向量化。
3.如权利要求1所述一种基于BLSTM的微博谣言检测方法,其特征在于在步骤3)中,所述用word2vec方法构建样本句矩阵的具体方法为:采用BLSTM模型对样本句矩阵进行训练,构建训练模型;BLSTM每一个训练序列向前和向后分别是两个LSTM神经网络,所述两个LSTM神经网络连接一个输出层,提供给输出层输入序列中每一个点的完整的过去和未来的上下文信息,展示的是一个沿着时间展开的双向循环神经网络,6个独特的权值在每一个时步被重复的利用,6个权值分别对应:输入到向前和向后隐含层,隐含层到隐含层自己,向前和向后隐含层到输出层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711436582.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种Excel文件解析方法
- 下一篇:基于强化学习的关系抽取方法和装置