[发明专利]在大数据库中根据化学结构相似性搜索和显示可用信息的系统、装置和方法有效
申请号: | 201780050169.X | 申请日: | 2017-12-05 |
公开(公告)号: | CN109791797B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 李志峰;汉斯·马库斯;侯赛因·阿里;张岩;汪逍;任泽 | 申请(专利权)人: | 智慧芽信息科技(苏州)有限公司 |
主分类号: | G16C20/70 | 分类号: | G16C20/70 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 王小衡;王天鹏 |
地址: | 215000 江苏省苏州市苏州工业*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 根据 化学 结构 相似性 搜索 显示 可用 信息 系统 装置 方法 | ||
本发明的实施例涉及以下系统、方法和装置:其用于改进在广泛的数据库中可用的专利和其他文献内部以及该专利和其他文献之间的信息空间中搜索化学结构内容,并且其包含用于以地图形式可视化化学空间的新工具。更具体地,本发明的实施例涉及这样的系统、方法和装置:其用于使用可从各种数据库和基于因特网的资源获得的公共信息来获得和分组信息以确定类似化学结构,承担三维地图分析以访问那些类似的结构,并获得有关它们的其他信息,该其他信息包括但不限于专利数据、专利同族结构、诉讼相关信息、监管和营销批准信息、以及帮助用户了解与某些感兴趣的化学结构以及有关化学结构相关联的医疗、技术和法律环境的其他类型的信息。另外,实施例提供了搜索结果和内容项的新的导航范例,使得用户可以更直观且更有效率地获取和操纵与基于其化学相似性分组的化学结构有关的信息。
相关申请的交叉引用
本申请要求2016年12月5日提交的题为“Searching and Displaying Documentsin Large Databases According to the Similarity of Chemical StructuresDiscussed in Them”的美国临时申请No.62/430,289的优先权。该申请通过引用整体并入本文。
技术领域
本发明的实施例涉及以下系统、方法和装置:其用于改进在广泛的数据库中可获取到的专利和其他文献内部以及该专利和其他文献之间的信息空间中搜索化学结构内容,并且其包含用于以地图形式(landscape format)可视化化学空间的新工具。更具体地,本发明的实施例涉及这样的系统、方法和装置:其用于使用可从各种数据库和基于因特网的资源获得的公共信息来获得和分组信息以确定类似化学结构,承担三维地图分析以访问那些类似的结构,并获得有关它们的其他信息,该其他信息包括但不限于以下信息:专利数据、专利同族结构、诉讼相关信息、监管和营销批准信息、以及帮助用户了解与某些感兴趣的化学结构以及有关化学结构相关联的医疗、技术和法律环境的其他类型的信息。
背景技术
诸如因特网、企业网络、文档存储库以及信息存储和检索服务之类的信息空间允许广泛访问大量信息。例如,用户通常使用因特网搜索引擎来在因特网上或公共或专有数据库上定位和选择期望的信息,所述期望的信息涉及:产品、个别专利及其关联数据;简单和复杂的专利同族信息;与专利所涵盖产品相关联的监管活动,诸如FDA批准、延期、调整和减少专利条款、影响专利权的法院和机构活动以及某些专利权利要求条款的适当解释;以及与某些化学品相关联的医疗信息,包括受到监管监督和批准的药物产品中发现的活性药物成分(API)。执行与化学结构和专利相关的搜索的各种各样的用户有兴趣理解与这些结构有关的许多因素和数据片段,并且有兴趣分析和最终确定与其搜索最相关的驻留在信息孤岛和离散数据库中的许多信息片段的优先级。
虽然手动搜索和比较这样的信息可以向用户提供一些有用的信息,但是当前的工具不能提供一种系统、方法或装置,来向用户给出涉及类似化学结构和化学空间的可视化的实时更新和化学结构分组。
搜索引擎帮助用户定位信息空间中的项。这些项可以包括文档、图像、视频和本领域中已知的许多其他类型的文件。搜索引擎典型地使用搜索算法,该搜索算法采用文字关键字匹配技术或对用户查询或搜索请求中指定的单词或符号的近似匹配。因此,在离散数据集和数据库中的常规搜索中,搜索信息的用户必须提供有希望匹配期望的内容的关键字。然而,在实践中,对内容用户和内容提供者来说,这种方法只不过是一种猜谜游戏,并且当搜索涉及化学结构时尤其困难。各种关键字可用于概念性想法,这可能使标记和关键字搜索变得困难。另外,在提供关于特定化学结构的信息的系统之间,给定的关键字组合不太可能是相同的。因此,搜索引擎内对化学结构以及与那些结构相关联的信息的概念匹配或语义匹配可能很差且不一致。常规搜索和分析工具在确定化学结构中所固有的含义方面也可能是无效的。对于许多系统,内容以自然语言表达,其中没有约定或化学结构组织来管理内容的含义或聚类。因此,搜索引擎通常不能可靠地定位或分组最合适或相关的化学结构内容。目前,依靠当前的搜索工具基于这些结构的相似性对化学结构内容进行分组或组织是不可行的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智慧芽信息科技(苏州)有限公司,未经智慧芽信息科技(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780050169.X/2.html,转载请声明来源钻瓜专利网。