[发明专利]应用题解题知识库的构建方法、装置及应用题解题机器人在审
申请号: | 202210107369.7 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114610835A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 齐振宇;徐波 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/332;G06F16/36;G06N5/02;G09B7/02 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 聂俊伟 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用题 解题 知识库 构建 方法 装置 机器人 | ||
1.一种应用题解题知识库的构建方法,其特征在于,包括:
构建数学知识子库和构建常识知识子库;
将所述数学知识子库和所述常识知识子库联立,构成应用题解题知识库,并分别为所述数学知识子库和所述常识知识子库配置对应的查询接口。
2.根据权利要求1所述的应用题解题知识库的构建方法,其特征在于,所述构建数学知识子库,具体包括:
对权威材料进行挖掘,获取与三类数学知识实体相关的数学知识实体集合,搭建所述数学知识子库的骨架;
所述三类数学知识实体包括数学知识主题、数学知识点和数学知识概念;所述权威材料包括与教材及考试大纲相关的文档、书籍和试卷;
对权威材料和各种教辅材料进行挖掘,获取与所述三类数学知识实体相关的数学知识内容集合,以利用所述数学知识内容集合对所述数学知识子库的骨架进行填充,创建所述数学知识子库。
3.根据权利要求2所述的应用题解题知识库的构建方法,其特征在于,所述对权威材料进行挖掘,获取与三类数学知识实体相关的数学知识实体集合,搭建所述数学知识子库的骨架,包括:
基于OCR技术,将纸质版的所述权威材料转化为电子化文档;
去掉所述电子化文档中的乱码部分和无意义数据部分,实现对所述电子化文档的数据清洗;
基于人机混合的方式,从经过数据清洗后的电子化文档中,抽取出所述数学知识实体集合,以搭建所述数学知识子库的骨架。
4.根据权利要求2-3任一项所述的应用题解题知识库的构建方法,其特征在于,还包括:
获取新版本的权威材料,根据从所述新版本的权威材料中提取出的新的数学知识内容,对所述数学知识子库进行扩充;
和/或,获取未处理过的教辅材料,根据从所述未处理过的教辅材料中提取出的新的数学知识内容,对所述数学知识子库进行扩充;
和/或,获取所述数学知识子库中缺失的数学知识内容,以将所述缺失的数学知识内容扩充至所述数学知识子库。
5.根据权利要求1所述的应用题解题知识库的构建方法,其特征在于,所述构建常识知识子库,具体包括:
构建概念型常识内容集合和构建其它常识内容集合,以通过整合所述概念型常识内容集合和所述其它常识内容集合,构成所述常识知识子库;
所述其它常识内容集合包括数值型常识内容集合、状态型常识内容集合和同位型常识内容集合。
6.根据权利要求5所述的应用题解题知识库的构建方法,其特征在于,所述构建概念型常识内容集合,具体包括:
基于公开知识源的架构,并结合从大批量应用题范例中所提取到的候选概念集合,搭建概念上下位框架;
获取与所述概念上下位框架中的各候选概念相关的候选目标属性,构建候选目标属性集;
根据所述候选目标属性集,分别为所述概念上下位框架中的各候选概念的目标属性赋予目标属性值,以获取多个由候选概念、目标属性和目标属性值组成的三元组;
将包含所有所述三元组的三元组集合,组成所述概念型常识内容集合。
7.根据权利要求6所述的应用题解题知识库的构建方法,其特征在于,所述公开知识源包括Schema.org、Wikipedia、HowNet、网络百科中的至少一种。
8.根据权利要求5所述的应用题解题知识库的构建方法,其特征在于,所述构建其它常识内容集合,具体包括:
通过启发式规则从开放数据源中抽取出数值型常识内容、状态型常识内容和同位型常识内容,分别构成所述数值型常识内容集合、所述状态型常识内容集合和所述同位型常识内容集合;
和/或,通过模板检索的方式从搜索引擎中获取数值型常识内容、状态型常识内容和同位型常识内容,分别构成所述数值型常识内容集合、所述状态型常识内容集合和所述同位型常识内容集合;
和/或,基于中文分词、命名实体识别和名词短语识别对大批量数学应用题范例进行关键词提取,获取数值型常识内容、状态型常识内容和同位型常识内容,分别构成所述数值型常识内容集合、所述状态型常识内容集合和所述同位型常识内容集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210107369.7/1.html,转载请声明来源钻瓜专利网。