[发明专利]一种基于二元关系的知识学习方法和系统在审
申请号: | 201711262764.8 | 申请日: | 2017-12-04 |
公开(公告)号: | CN108280055A | 公开(公告)日: | 2018-07-13 |
发明(设计)人: | 黄劲;林载辉 | 申请(专利权)人: | 盈盛资讯科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06N3/04;G06N3/08;G06N5/02 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭英强 |
地址: | 中国香港新界沙田香港科学园科*** | 国省代码: | 中国香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于二元关系的知识学习方法和系统,该方法通过将训练数据库、材料数据库中的短语和/或句子通过自然语言处理方法解析,得到词树;获取训练数据的词树中词节点的标注信息和二元词关系的标注信息,并将词树以及对应的标注信息作为模板存储到模板库;通过少量训练数据基于二元关系建立模板库,通过机器学习从模板库中得到学习技巧,并对待学习的材料数据应用学习技巧,应用成功则对学到的知识进行存储,否则得到新的模板并增加至模板库,随时可扩充模板库,因此不需要对相同的或类似的学习材料进行大量重复标注,极大减轻了人工工作量,提高复用性。本发明作为一种基于二元关系的知识学习方法和系统可广泛应用于人工智能领域。 | ||
搜索关键词: | 模板库 二元关系 标注信息 知识学习 词树 训练数据 人工智能领域 自然语言处理 材料数据库 人工工作量 训练数据库 短语 材料数据 机器学习 模板存储 学习材料 应用成功 复用性 可扩充 学习 句子 标注 解析 应用 存储 重复 | ||
【主权项】:
1.一种基于二元关系的知识学习方法,其特征在于,包括有以下步骤:A、将训练数据库中的短语和/或句子通过自然语言处理方法解析,得到训练数据的词树;B、获取训练数据的词树中词节点的标注信息,并根据词节点的标注信息对词树进行标注形成一元模板;C、获取训练数据的词树中二元词关系的标注信息,根据二元词关系的标注信息对一元模板进行标注形成模板并存储到模板库;D、将材料数据库中的短语和/或句子通过自然语言处理方法解析,得到材料数据的词树;E、采用机器学习处理模板库中的模板,得到基于模板的学习方法;F、对材料数据的词树逐个应用基于模板的学习方法,若应用成功,则将学习到的知识进行存储;若应用失败,则重新执行步骤B、C和E。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盈盛资讯科技有限公司,未经盈盛资讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711262764.8/,转载请声明来源钻瓜专利网。