[发明专利]生成或修改表示输入数据内的关系的本体在审
申请号: | 202010783566.1 | 申请日: | 2020-08-06 |
公开(公告)号: | CN112347781A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 胡意仪;李岩;孙惠川;周俭;樊嘉 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G16H50/70 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 孟杰雄 |
地址: | 荷兰艾*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 修改 表示 输入 数据 关系 本体 | ||
一种用于利用至少两种处理技术协调对包含数据项(例如,医学文本)的输入数据的分析的方法和系统。两种不同的处理技术处理所述输入数据的相应部分以识别所述输入数据的所述数据项之间的关系。然后确定每个处理技术的准确性,并且基于所确定的准确性来自动改变相应部分的大小,用于处理输入数据的后续迭代。
技术领域
本发明涉及生成/修改表示输入数据内的关系的本体的领域。
背景技术
医学文献数据库(例如,PubMed)是用于临床知识挖掘的丰富数据源。这些数据库提供能够用于建立临床/处置指南的丰富信息,例如,由研究人员识别医学文献中指出的处置与成功水平之间的关系。
然而,对于人类研究人员来说,阅读文献以建立指南是极其劳动密集型的。因此,需要一种智能处理系统,其能够检测论文讨论的模态,自动概括研究结果并呈现给临床医生。
设计这种系统的第一步是创建表示医学文献的不同数据项(例如,单词或短语)之间关系的本体。该本体还可以用作模态检测器。例如,本体可以使用三元组存储或图形结构/数据库(例如,其采用属性图形模型)来编码关系。然而,构造本体是极具挑战性的,例如,由于自由文本中包含的复杂组合模态、复杂的依赖性等等。
创建本体或修改现有本体的现有解决方案采用机器学习算法来处理医学文献。然而,用于这种机器学习算法的训练数据的创建是困难且耗时的,需要大量参与者来提供足够的训练数据以用于医学文献的准确处理。
因此,期望提供一种能够在计算机上实现的生成(或修改)本体的改进方法。特别地,期望有助于计算机上的输入数据之间的关系的自动确定的准确实现。
发明内容
本发明由权利要求书限定。
根据依照本发明的一个方面的示例,提供了一种生成或修改表示输入数据内的关系的本体的计算机实现的方法。所述方法迭代地包括:获得用于处理的输入数据,输入数据包括多个数据项;使用第一处理技术来处理所述输入数据的第一部分,所述第一处理技术被配置为识别所述输入数据的不同数据项之间的关系,所述第一部分的大小是所述输入数据的第一百分比;使用不同的第二处理技术来处理所述输入数据的不同的第二部分,所述第二处理技术被配置为识别所述输入数据的不同数据项之间的关系,第二部分的大小是输入数据的第二百分比;基于由第一处理技术和第二处理技术识别的不同数据项之间的所述关系来生成或修改本体;确定第一处理技术和第二处理技术中的每个的准确性;并且,基于所确定的第一处理技术和第二处理技术中的每个的准确性来调整第一百分比和第二百分比的大小,用于对未来输入数据的处理。
所提出的发明提供了一种用于生成本体(诸如,知识图形或知识库)的自动或半自动方法,所述方法识别输入数据的不同数据项或实体之间的关系。本发明由此解决了如何使用计算机或处理器准确地实现(半)自动确定这种关系的问题。
(至少)两种不同处理技术的使用允许使用最准确的技术来生成本体。通过迭代地调整输入数据的每个比例的百分比,可以对最准确的技术进行加权,以提供对所生成/修改的本体更大的影响。这提高了本体的准确性,并且避免了任何单个处理技术的瓶颈。
所提出的方法控制如何利用处理技术,以便生成本体。特别地,所提出的发明有助于计算机使用(至少)两种处理技术来处理输入数据,从而有助于在计算机上输入数据内的关系的自动确定的准确实现。
此外,通过准确地识别关系,所生成的本体能够用于输入数据的更准确的处理,例如,用于后续搜索工具。作为示例,如果输入数据是文本医学数据,则医学问题和回答系统可以更准确地检索对问题的适当回答(因为问询与回答之间的关系可以由本体建立)。基于本体的搜索比其他搜索更简单和有效。
优选地,本体识别输入数据的至少两个数据项以及两个数据项之间的关系。本体的适当示例包括存储一个或多个(语义)三元组的三元组存储、知识图形/库、实体关系模型等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010783566.1/2.html,转载请声明来源钻瓜专利网。