[发明专利]一种基于模板的知识学习方法和系统在审
申请号: | 201711260806.4 | 申请日: | 2017-12-04 |
公开(公告)号: | CN108154234A | 公开(公告)日: | 2018-06-12 |
发明(设计)人: | 黄劲;林载辉 | 申请(专利权)人: | 盈盛资讯科技有限公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭英强 |
地址: | 中国香港新界沙田香港科学园科*** | 国省代码: | 中国香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模板库 知识学习 词树 标注信息 训练数据 人工智能领域 自然语言处理 材料数据库 人工工作量 训练数据库 短语 材料数据 机器学习 模板存储 学习材料 应用成功 复用性 可扩充 学习 句子 标注 解析 应用 存储 重复 | ||
本发明公开了一种基于模板的知识学习方法和系统,该方法通过将训练数据库、材料数据库中的短语和/或句子通过自然语言处理方法解析,得到词树;获取训练数据的词树中词节点的标注信息,并将词树以及对应的标注信息作为模板存储到模板库;通过少量训练数据即可建立模板库,通过机器学习从模板库中得到学习技巧,并对待学习的材料数据应用学习技巧,应用成功则对学到的知识进行存储,否则得到新的模板并增加至模板库,随时可扩充模板库,因此不需要对相同的或类似的学习材料进行大量重复标注,极大减轻了人工工作量,提高复用性。本发明作为一种基于模板的知识学习方法和系统可广泛应用于人工智能领域。
技术领域
本发明涉及人工智能领域,尤其是一种基于模板的知识学习方法和系统。
背景技术
人工智能的一个领域是让机器直接学习人学习的材料,即用自然语言表达的材料,并用学到的知识指导其进行工作。学习的其中一种做法是对大量的材料进行标注,让机器从标注中学习这些材料的格式,从而机器可以从相同或者相似格式的其他材料中学到知识。
上述做法的局限性在于,需要对大量的材料进行标注,所以一般只能针对特定领域,例如在某论文中,为了实现机器医疗辅助诊断,需要对几千乃至上万份病例进行标注,这样机器才能看懂相似格式的病例,从中学到知识,而如果换了另一种类型的材料,例如B超结果,或者换了一种全新格式,如另外一家医院的病例,又需要重新进行大量材料的标注,工作重复性高、效率低。
发明内容
为了解决上述技术问题,本发明的目的是:提供一种基于模板实现减少人工成本、提高复用性的知识学习方法。
为了解决上述技术问题,本发明的另一目的是:提供一种基于模板实现减少人工成本、提高复用性的知识学习系统。
本发明所采用的技术方案是:一种基于模板的知识学习方法,其特征在于,包括有以下步骤:
A、将训练数据库中的短语和/或句子通过自然语言处理方法解析,得到训练数据的词树;
B、获取训练数据的词树中词节点的标注信息,并将词树以及对应的标注信息作为模板存储到模板库;
C、将材料数据库中的短语和/或句子通过自然语言处理方法解析,得到材料数据的词树;
D、采用机器学习处理模板库中的模板,得到基于模板的学习方法;
E、对材料数据的词树逐个应用基于模板的学习方法,若应用成功,则将学习到的知识进行存储;若应用失败,则重新执行步骤B和D。
进一步,所述自然语言处理方法包括有依存句法分析和/或语义依存分析。
进一步,所述步骤D中采用机器学习处理的具体步骤为:将模板库中的模板输入人工神经网络进行训练,所述基于模板的学习方法以人工神经网络的形式存储。
进一步,所述标注信息包括有词树转化为知识的规则。
进一步,所述词树转化为知识的规则包括有知识体系的定义。
本发明所采用的技术方案是:一种基于模板的知识学习系统,包括有
训练数据库,用于存储典型短语和句子;
材料数据库,用于存储待学习的材料数据;
模板库,用于存储用于知识学习的模板;
知识库,用于存储学习到的知识;
自然语言处理模块,用于将训练数据库和材料数据库中的短语或句子解析为词树;
标注模块,用于获取词树中词节点的标注信息;
模板生成模块,用于根据标注模块获取的词节点的标注信息对词树进行标注形成模板并存储至模板库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盈盛资讯科技有限公司,未经盈盛资讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711260806.4/2.html,转载请声明来源钻瓜专利网。