[发明专利]基于卷积神经网络的慕课论坛主题分类方法在审
申请号: | 201810537101.0 | 申请日: | 2018-05-30 |
公开(公告)号: | CN108846425A | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 刘胜蓝;冯林;王飞龙;刘国超 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 大连星海专利事务所有限公司 21208 | 代理人: | 裴毓英 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 主题分类 用户行为特征 论坛 论坛用户 用户行为数据 方法使用 行为数据 自动学习 抽取 抽象 筛选 分类 记录 学习 | ||
本发明公开了一种基于卷积神经网络的慕课论坛主题分类方法,包括:对慕课论坛用户的行为进行记录并手工设计抽取相应的用户行为数据特征,使用卷积神经网络不断学习上述手工设计的用户行为特征,得到更高层次的更具判别力的用户行为特征表示,然后利用该特征对慕课论坛的主题进行分类,提高慕课论坛主题划分的效果。本发明方法使用卷积神经网络自动学习和抽象手工设计的论坛用户行为数据特征,获得更具判别力的慕课论坛主题分类特征,提高了慕课论坛主题分类的效果并可以减少用户手工设计、筛选用户行为特征的困难。
技术领域
本发明涉及数据挖掘领域,尤其涉及一种基于卷积神经网络的慕课论坛主题分类方法。
背景技术
大型在线课程(Massive open online course,慕课)的兴起使得教育大数据挖掘成为了热门且困难的数据挖掘研究方向之一,慕课论坛主题是在线课程用户关于课程发表提出的问题,自动准确地对论坛主题进行分类一直是提高在线教育课程质量的关键之一。多语种,多学科的慕课论坛主题讨论内容使得基于自然语言处理的数据挖掘技术失效。不同类别主题的用户行为特征具有很大的差别。如关于作业的主题,其讨论帖的发表速度,浏览次数以及得到赞的个数都和关于交友的主题差异很大,因此可以手工设计不同主题的用户行为特征作为慕课论坛主题分类的特征输入。
但是用户行为特征的设计和筛选都极其困难,需要对慕课论坛的主题用户的行为极其熟悉且具备相当强的数据分析能力,才能设计出一个良好的用户行为特征。深度学习尤其是卷积神经网络表现出了从原始特征学习出更加复杂抽象且具备良好判别力特征的能力,因此本发明利用卷积神经网络降低用户行为特征设计和筛选的困难,自动学习到更好的用户行为特征的表示,从而提升慕课论坛主题分类的效果。
发明内容
本发明实施例提供一种基于卷积神经网络的慕课论坛主题分类方法,该方法利用卷积神经网络不断从原始用户行为特征学习出更加复杂和具备判别力的用户行为特征,提升了慕课论坛主题分类的效果和减轻了用户行为特征设计、筛选的困难。
本发明提供的基于卷积神经网络的慕课论坛主题分类方法,包括以下步骤:
步骤S101:收集并记录慕课论坛用户的行为数据,手工设计一定量原始用户行为特征;
步骤S102:利用卷积神经网络组合抽象手工设计的原始用户行为特征,并且定义最终神经网络需要优化的目标函数;
步骤S103:通过反向传播算法学习得到每一层网络参数的权重,从而得到一个判别性强且抽象的用户行为特征表示,使用逻辑回归算法和该特征对慕课论坛主题进行分类。
优选的,所述步骤S102,利用卷积神经网络学习得到比原始论坛用户行为特征更加抽象的表示。
优选的,利用卷积神经网络不断组合原始论坛用户行为特征,并且定义最终神经网络需要优化的目标函数;
首先给定慕课论坛主题的原始用户行为特征X和标签Y,以及卷积神经网络F(W,X),可以得到原始用户行为特征X的抽象表示Xconv,主题的标签预测结果其目标函数L如下公式所示:
其中argmin表示求取该目标函数的最小值,s.t.表示目标函数的约束。
通过使用反向传播算法不断迭代优化目标函数,得到该目标函数一个较优的解;反向传播一般使用随机梯度下降算法,目标函数L是非凸函数,随机梯度下降算法可以不断更新神经网络的参数W,从而获得原始用户行为特征X的一个较优的抽象表示Xconv。
优选的,所述步骤S103:通过反向传播学习得到神经网络的权值W,从而得到原始用户行为特征X的一个较优的抽象表示Xconv,使用Xconv和相应的机器学习分类算法如逻辑回归,支持向量机等可以对慕课论坛主题进行良好地分类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810537101.0/2.html,转载请声明来源钻瓜专利网。