[发明专利]一种基于虚拟实验平台的自动评分的方法有效
申请号: | 201910508859.6 | 申请日: | 2019-06-13 |
公开(公告)号: | CN110245860B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 谢旭锋;覃远年 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/20;G06F40/289;G06N3/04 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 刘梅芳 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 虚拟 实验 平台 自动 评分 方法 | ||
1.一种基于虚拟实验平台的自动评分的方法,其特征是,包括如下步骤:
1)输入文本数据:输入主观题文本数据;
2)自然语言预处理:先将输入主观题的文本数据通过切词工具切词,然后将切词好后的数据采用为虚拟实验专门设计的字典即自定义该字典来代替数据库,该字典内容根据实验的内容自主添加词语,分配给每一个词组不同的数字ID,最后将主观题文本数据以数字的形式输出,本例采用在GitHub上的开源切词工具jieba进行切词处理,自然语言预处理的过程为:统计虚拟实验操作可能会使用到的所有词语,为每个词语分配一个ID,建立一个自定义的字典作为数据库,将文本转化为词语编号形式,除了加入预料出现的词语以外还需要加入句子起始符“sos”、句子结束符“eos”和停用词“unk”,当出现不是为虚拟实验专门设计的字典中的词语时将其替换为停用词“unk”,原本的数据将转化为词语编号,并保存,接着将预处理完的数据进行筛选,去除句子起始符“sos”、句子结束符“eos”和停用词“unk”,将经过切词后的数据通过为虚拟实验专门设计的字典进行筛选,保留存在于字典中文本信息,并将其转为数字向量再输出;
3)题型分类:采用长短时记忆网络LSTM通过人工智能的方式将不同题型的学生答案进行自动分类,即将经过自然语言预处理完后得到的数字向量输入到LSTM神经网络中,将通过LSTM神经网络后得到的原始输出值通过softmax层将结果表示为概率分布的形式,假设神经网络原始的输出值为y1,y2,…,yn,经过softmax处理之后的输出为:
将输出结果与所有题型标准答案通过交叉熵公式H(p,q)=-∑p(x)log q(x)获得的交叉熵的大小,最小结果为匹配度最高的题型,从而将文本数据分类到相应的题型中去,将输入的值分配给概率最高的题型,题型分类阶段具体实现方式如下:通过自然语言预处理将词语转化为数字向量,将数字向量输入到LSTM神经网络中,接着将通过LSTM神经网络后得到的原始输出值通过softmax层使其结果以概率分布的形式表示,系统会根据概率将数字向量输入值所对应的文本信息分配给概率最高的题型中,
LSTM是一种拥有三个“门”结构的特殊网络结构,LSTM靠一些“门”的结构让信息有选择性地影响循环神经网络中每个时刻的状态,所谓“门”的结构就是一个使用sigmoid神经网络和一个按位做乘法的操作,这两个操作合在一起就是一个“门”的结构,之所以该结构叫做“门”是因为使用sigmoid作为激活函数的全连接神经网络层会输出一个0到1之间的数值,描述当前输入有多少信息量可以通过这个结构,于是这个结构的功能就类似于一扇门,当门打开时即sigmoid神经网络层输出为1时,全部信息都可以通过;当门关上时即sigmoid神经网络层输出为0时,任何信息都无法通过,为了使循环神经网更有效的保存长期记忆,“遗忘门”和“输入门”至关重要,它们是LSTM结构的核心,“遗忘门”的作用是让循环神经网络“忘记”之前没有用的信息,“遗忘门”会根据当前的输入xt和上一时刻输出ht-1决定哪一部分记忆需要被遗忘,f取值接近0的维度上的信息就会被“忘记”,而f取值接近1的维度上的信息会被保留,在循环神经网络“忘记”了部分之前的状态后,它还需要从当前的输入补充最新的记忆,这个过程就是“输入门”完成的,“输入门”会根据xt和ht-1决定哪些信息加入到状态ct-1中生成新的状态ct,
具体LSTM每个“门”的公式定义如下:
i=sigmoid(Wi[ht-1,xt]) 输入门f=sigmoid(Wf[ht-1,xt]) 遗忘门
o=sigmoid(Wo[ht-1,xt]) 输出门ct=f·ct-1+i·z 新状态
ht=o·tanct 输出
交叉熵刻画了两个概率分布之间的距离,交叉熵的值越小则越接近正确结果;
4)评分过程:采用循环神经网络RNN对进行完题型分类的数据进行处理获得输出值,依据决策树算法建立的评分模型进行评分,最后输出评分结果;
步骤4)中所述的循环神经网络结构及处理原理为:RNN是一种特殊的神经网络结构,是一个单元结构重复使用的神经网络结构,将完成题型分类的数据按照自然语言处理后的数字向量形式输入,采用设定循环体内部向量的值获得每一单词向量输入后所得的新结果,该结果可以被视为输出值也可以被视为下一时刻的输入值,每一时刻所获得的输出值和最终的输出值都将被保留用于接下来的评分,RNN数据处理过程为:
假设状态的维度为2,输入、输出的维度都为1,而且循环体中的全连接层中权重为:
偏置项的大小为br=[0.1 -0.1],用于输出的全连接层权重为:偏置项大小为bo=0.1,那么在时刻t0,将状态初始化为[0 0],而当前的输入为1,所以拼接得到的向量为[0 0 1],通过循环体中的全连接层神经网络得到的结果为:
依据上述处理方式后所获得的输出值就是依据每步操作后的结果与最终操作结果以数值的形式表示,最后将每一时刻所获得的输出值和最终的输出值放入评分模型就可以获得最终的得分;
步骤4)中所述的评分模型为决策树模型,即将实验评分的要求作为决策树的每个节点,树的分支代表每一要求所对应的结果,通过将循环神经网络的输出值放入决策树模型中,获得最终的评分结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910508859.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种物业管理安保系统
- 下一篇:一种基于数据分析的彩盒生产用管理系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理