[发明专利]一种题目特征表示方法、装置及存储介质有效
申请号: | 201910469110.5 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110362723B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 张家新 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032;G06F16/907;G06F16/33;G06F16/36 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 董永辉;曹素云 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 题目 特征 表示 方法 装置 存储 介质 | ||
本方案涉及人工智能,提供一种题目特征表示方法,包括:获取题目中的多个知识点,通过知识点之间的关系构成知识图谱:使用自定义词库来对文本内容进行数据清洗,使得文本内容仅保留存有在自定义词库中的词语;通过词向量算法将文本内容中的每个词转化成词向量;通过字符向量算法将公式转化成字符向量;通过卷积‑反卷积自编码器将图像转换为像素矩阵;将知识图谱的实体向量、词向量、字符向量、像素矩阵组合在一起,形成题目信息矩阵。本发明提取的题目的特征数据包含了文本、公式、图像、字符等全部信息,对于数学题目推荐和数学题目分类等都能够提高其精确度。
技术领域
本发明涉及人工智能领域,具体说,涉及一种题目特征表示方法、装置及存储介质。
背景技术
目前,题目特征提取中更多只是提取了题目中的文本内容,而对于知识点间的关系、图像里面的内容、公式中的内容并没有提取出来。而数学中通常存在大量的知识点,知识点间的语义关系可以有效地扩展题目的特征表示。然而这种语义关系难以被传统方法(话题模型、词向量)发掘出来。
发明内容
为解决以上技术问题,本发明提供一种题目特征表示方法,应用于电子装置,包括:
获取题目中的多个知识点,通过知识点之间的关系构成知识图谱;
使用自定义词库来对题目中的文本内容进行数据清洗,使得所述文本内容仅保留存有在自定义词库中的词语;
通过词向量算法将经过数据清洗后的文本内容中的每个词转化成词向量;
通过字符向量算法将题目中的公式转化成字符向量;
通过卷积-反卷积自编码器将题目中的图像转换为像素矩阵;
获取所述知识图谱的实体向量,将所述实体向量、词向量、字符向量、像素矩阵组合在一起,形成题目信息矩阵。
本发明还提供一种电子装置,该电子装置包括:存储器和处理器,所述存储器中存储有题目特征表示程序,所述题目特征表示程序被所述处理器执行时实现如下步骤:
获取题目中的多个知识点,通过知识点之间的关系构成知识图谱;
使用自定义词库来对题目中的文本内容进行数据清洗,使得所述文本内容仅保留存有在自定义词库中的词语;
通过词向量算法将经过数据清洗后的文本内容中的每个词转化成词向量;
通过字符向量算法将题目中的公式转化成字符向量;
通过卷积-反卷积自编码器将题目中的图像转换为像素矩阵;
获取所述知识图谱的实体向量,将所述实体向量、词向量、字符向量、像素矩阵组合在一起,形成题目信息矩阵。本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,实现如上所述的题目特征表示方法。
本发明集合了知识点构成的实体向量、特定词语转换成的词向量、公式转化成字符向量、像素矩阵,并通过上下文实体来刻画实体向量。题目的特征数据包含了文本、公式、图像、字符等全部信息,对于数学题目推荐和数学题目分类等都能够提高其精确度。
附图说明
通过结合下面附图对其实施例进行描述,本发明的上述特征和技术优点将会变得更加清楚和容易理解。
图1是表示本发明实施例的题目特征表示方法的流程图;
图2是表示本发明实施例的电子装置的硬件架构示意图;
图3是表示本发明实施例的题目特征表示程序的程序模块示意图;
图4是表示word2Vec方法的模型构成图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910469110.5/2.html,转载请声明来源钻瓜专利网。