[发明专利]存储介质、数据库构建方法和信息处理设备在审
申请号: | 202210697809.9 | 申请日: | 2022-06-20 |
公开(公告)号: | CN115952861A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 广本正之 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06N5/04;G06F16/33;G06F16/36;G06F16/58 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘雯鑫;乔图 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存储 介质 数据库 构建 方法 信息处理 设备 | ||
公开了存储介质、数据库构建方法和信息处理设备。一种存储有数据库构建程序的非暂态计算机可读存储介质,该数据库构建程序使计算机执行处理,该处理包括:分析输入图像或文本以生成包括限定多个第一词类与多个第二词类之间的关系的多个子图形的语义表示;从存储在数据库中的多个子图形中提取与包括在语义表示的多个子图形中的第一词类有关系的第三词类;生成包括多个子图形的第一知识,在多个子图形中用第三词类替换了语义表示的多个子图形中的第一词类;以及将基于语义表示和数据库通过从包括在第一知识中的多个子图形中去除矛盾子图形而获得的剩余子图形登记在数据库中。
技术领域
本文中所讨论的实施方式涉及存储介质、数据库构建方法和信息处理设备。
背景技术
近年来,神经网络(NN)在诸如语法分析和图像识别的领域中被积极地使用。例如,使用深度学习(DL)显著地提高了语法分析和图像识别的准确度。
在许多类型的当前机器学习中,通过使用对应于任务的训练数据来执行训练。同时,当人执行语法分析或图像识别时,除了针对每个任务的训练之外,人还通过使用“常识”来做出确定。因此,使用常识在机器学习中也被认为是有用的。
作为相关技术中常识使用的基础技术,存在一种将NN和超维计算(HDC)结合的技术,HDC是一种专注于大脑中信息表示的非冯诺依曼计算技术。这使得能够从常识数据库(DB)中获取和使用常识并且将知识表达为语法分析和图像识别中的超维向量(HV)。
图12是示出常识DB的示例的图。常识DB是图形格式的常识集合,并且被表示为分别具有三元组作为元素的集合。例如,常识DB的格式是(“主语”,“谓语”,“宾语”)。“主语”表示要成为主语的事物,“宾语”表示要成为宾语的事物,以及“谓语”表示这些事物之间的关系。例如,图12的图形5包括三元组,例如(“人类”,“能够”,“绘制”)和(“绘制”,“与之相关”,“图片”)。要登记在常识DB中的数据被手动地收集。
美国专利第10740398号和日本公开特许公报第2013-175097号被公开为相关技术。
发明内容
[技术问题]
然而,在上面描述的相关技术中,存在无法通过使用已经构建的常识DB来构建新图形的问题。
由于在相关技术的常识DB中手动地收集数据,因此存在在常识DB中发生数据遗漏或丢失的情况。因此,优选的是,基于现有常识DB和新获取知识来自动地获取新常识。
根据一个方面,本公开内容的目的是提供一种能够通过使用已经构建的常识DB来构建新图形的数据库构建程序、数据库构建方法和信息处理设备。
[问题的解决方案]
根据实施方式的一方面,一种存储有数据库构建程序的非暂态计算机可读存储介质,该数据库构建程序使至少一个计算机执行处理,该处理包括:分析输入图像或文本以生成包括限定多个第一词类与多个第二词类之间的关系的多个子图形的语义表示;从存储在数据库中的多个子图形中提取与包括在语义表示的多个子图形中的第一词类有关系的第三词类;生成包括多个子图形的第一知识,在多个子图形中用第三词类替换了语义表示的多个子图形中的第一词类;以及将基于语义表示和数据库通过从包括在第一知识中的多个子图形中去除矛盾子图形而获得的剩余子图形登记在数据库中。
[发明的有益效果]
可以通过使用已经构建的常识DB来构建新图形。
附图说明
图1是示出根据相关技术的常识推理的示例的图;
图2A和图2B是用于说明HV的图;
图3是示出根据实施方式1的信息处理设备的配置示例的图;
图4是示出根据实施方式1的语义图形和子图形的示例的图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210697809.9/2.html,转载请声明来源钻瓜专利网。