[发明专利]用于语义信息可视化和指示生命科学实体之间显著关联的时间信号推断的系统、方法和计算机可读介质在审
申请号: | 201780071846.6 | 申请日: | 2017-09-22 |
公开(公告)号: | CN109964224A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 穆拉利·阿拉瓦穆丹;温卡塔拉马南·桑达拉贾;阿吉特·拉贾耶克哈兰;普拉桑·叶琳娜;阿尔俊·普拉尼克;阿什文·穆拉利;威廉·吉普森;恩里克·加西亚-里维拉;卡西克·穆卢加多斯 | 申请(专利权)人: | 恩芙润斯公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N5/02;G16B50/00 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 王小衡;王天鹏 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义实体 关联 语义 语义关联 计算机可读介质 集合 语义信息 时间片 知识库 生命科学 时间信号 可视化 时间段 嵌入 推断 输出 检测 | ||
公开的系统、方法和计算机可读介质可以检测语义实体之间的关联并生成实体之间的语义信息。例如,可以识别知识库中存在于的语义实体和相关联的语义集合。可以确定时间段并将其划分成时间片。可以为每个时间片生成所识别的语义实体的词嵌入;可以确定第一语义实体输入和第二语义实体输入之间的第一语义关联强度;以及可以确定第一语义实体输入和与语义集合相关联的语义实体之间的第二语义关联强度,所述语义集合与第二语义实体相关联。可以基于第一和第二语义关联强度来提供输出。
相关申请
本申请根据35U.S.C.§119(e)要求2016年9月22日提交的题为“用于语义信息可视化的方法和系统”的第62/398,386号美国临时专利申请和2017年6月2日提交的题为“用于指示生命科学实体之间显著关联的时间信号推断的方法和系统”的第62/514,697号美国临时专利申请的权益,其全部内容通过引用整体明确并入本文。
背景技术
技术领域
本公开的实施例涉及用于分析数据中潜在关系的系统、方法和计算机可读介质。
不论数据是多维的还是实时的,数据可视化的复杂性——特别是利用与线性相反的二维和三维布局——都在迅速提升,这促进了对数据和潜在关系的理解。然而,这些可视化方法对于呈现其中信息是非结构化的且需要语义推理来提取结构化信息的数据源是不太有效的。
某些数据源包含丰富的非结构化和半结构化信息,通常在制药行业不同组成部分的不同孤岛中访问。例如,转化医学和临床开发团队通常会访问clinicaltrials.gov网站;药物警戒研发科学家和进行市场调研的商业数据科学家等通常访问联邦不良事件报告系统(FAERS)。
目前,生成对用户查询的概要/摘要响应还面临着许多挑战,特别是当响应需要使用不同来源的结构化和非结构化信息进行语义合成时。例如,在当前系统中,尝试逐渐发展以超越仅对用户查询输出匹配结果的“概要式响应”其实很简单(例如,生成的响应中缺乏语义深度的单一来源的简单概要),可以实现自动化(例如,针对诸如“nfl季后赛”或“2012年选举”的查询的实时分数或选举状态表)。
因此,需要一种高级可视化系统来呈现语义信息。
现有技术中的一些方法依赖于通过研究引用两个实体的文档(即实体对同现的文档)随时间的增长来识别实体对之间的开创性关联。通常,此类方法的预测能力极小,尤其是当同现的文档数量仍然很少时(即,关联的相关知识处于初始阶段)。从定义上来说,这些方法只能在公开的时候捕捉开创性关联,而在公开之前则不能。引文索引等方法也需要长时间的监控才能进行重要的推断。通过查看给定出版物的引文,在公开开创性关联后,将会出现明显的积极信号,但这一信号不能用于预测。
现有技术中的其他方法(例如,谷歌word2vec)没有提供关于实体关联的时间分析的深刻见解。此外,由于行业特定语言用法导致从非结构化源识别实体(例如药物、基因、疾病)存在固有困难,因此,现有技术中用于自然语言处理(NLP)的通用方法在应用于任何特定行业(例如生命科学)时均存在许多缺点。
因此,需要一种高级系统来标记初期的和潜在的开创性关联,并随时间跟踪其显著性。
发明内容
根据所公开的主题,提供了用于语义信息可视化和指示生命科学实体之间显著关联的时间信号推断的系统、方法和计算机可读介质。
在详细解释根据本公开的示例性实施例之前,应当理解,本公开的应用不限于以下描述中阐述的或附图中示出的构造细节和布置。本公开能够具有除所描述的实施例之外的实施例,并且能够以各种方式实践和执行。此外,应当理解,本文以及摘要中使用的措辞和术语是为了描述,而不应被视为是限制性的。此外,虽然本公开中的讨论集中于生命科学领域,但是公开的系统和方法的应用不限于这一领域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恩芙润斯公司,未经恩芙润斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780071846.6/2.html,转载请声明来源钻瓜专利网。