[发明专利]一种基于智能问答的虚拟学习环境构建方法在审
申请号: | 201810581196.6 | 申请日: | 2018-06-07 |
公开(公告)号: | CN108804654A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 蔡林沁;颜勋;陈富丽;虞继敏 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 学习环境 虚拟 智能 答案特征向量 人机交互技术 虚拟现实技术 预处理 采集 计算模型 人机交互 特征提取 特征向量 问答数据 虚拟课堂 序列标注 语义分析 语义理解 置信度 分词 教学 语句 引擎 匹配 答案 输出 衡量 学习 引入 转换 拓展 应用 网络 研究 | ||
1.一种基于智能问答的虚拟学习环境构建方法,其特征在于:包括以下步骤:
S1:采集并构建特定领域教学问答数据集,对采集的问答对进行预处理;
S2:构建双向长短时记忆条件随机场BI-LSTM-CRF模型对问答对进行语义分析和特征提取,实现语句的分词与序列标注;
S3:构建基于长短时记忆LSTM网络的答案置信度计算模型,输入问答对特征向量,通过模型衡量问答对的匹配程度,将得分最高的答案特征向量转换输出;
S4:利用基于Unity3D的虚拟现实技术搭建虚拟学习环境,构建智能问答引擎,引入训练好的深度学习问答模型,完成基于智能问答的虚拟学习环境构建。
2.根据权利要求1所述的一种基于智能问答的虚拟学习环境构建方法,其特征在于:在所述步骤S1中,通过网络爬虫技术和人工收集途径获取问答数据,构建所述特定领域教学问答数据集。
3.根据权利要求1所述的一种基于智能问答的虚拟学习环境构建方法,其特征在于:在所述步骤S1中,对所述问答对的预处理首先是对收集的问答对进行去重、去空操作以剔除乱码无回答的数据,最终获得标准问答数据,使用浅层神经网络Word2Vec计算句子的词序列条件概率,将其嵌入并对词向量模型进行训练与计算。
4.根据权利要求1所述的一种基于智能问答的虚拟学习环境构建方法,其特征在于:在所述步骤S2中,对所述问答对进行语义分析和特征提取,包括以下步骤:
S21:利用所述步骤S1得到的标准问答数据和词向量模型对BI-LSTM-CRF模型进行训练测试;
S22:将向量化的问题文本序列X=(x1,x2,...,xn)输入到已训练好的网络模型,BILSTM综合前后词语的相关信息,CRF考虑输出标签之间的前后关系,经模型分词标注后,文本序列X对应的标注序列y=(y1,y2,...,yn)预测输出为:
其中,A为状态转移矩阵,P为BILSTM网络的输出矩阵,Ai,j表示时序上从第i个状态转移到第j个状态的概率,Pi,j表示输入观察序列中第i个词为第j个标注的概率。
5.根据权利要求1所述的一种基于智能问答的虚拟学习环境构建方法,其特征在于:在所述步骤S3中,通过基于LSTM网络的答案置信度计算模型对候选答案进行置信度排序,同时删除置信度较低的答案,选出最优回答;
使用调和余弦相似度和欧几里德距离的置信度计算方法计算问题答案的匹配度,问题答案的置信度cos ine和调和余弦相似度和欧几里德距离CosEuclid分别为:
Scorecosine(VQ,VA)=0.5(VQ,VA)+0.5 (3)
其中,VQ和VA分别对应问题答案的文本向量序列,而
Scorecosine(VQ,VA)=0.5(VQ,VA)+0.5是将余弦相似度归一化到[0,1]区间。
6.根据权利要求1所述的一种基于智能问答的虚拟学习环境构建方法,其特征在于:在所述步骤S4中,根据特定的实际教学情况,利用虚拟现实技术在Unity3D平台上搭建虚拟的课堂或实验室学习环境;创建可进行人机交互的虚拟教师与学生,在虚拟学习环境中为不同角色配置相应的问答脚本程序及功能;
在步骤S1-S3的基础之上,基于Unity3D平台,将构造好的模型通过构建的智能问答引擎与对应的特定虚拟教学环境对接,完成基于智能问答的虚拟学习环境构建。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810581196.6/1.html,转载请声明来源钻瓜专利网。