[发明专利]用于识别具有目标性质的实体的系统和方法有效
申请号: | 201680067948.6 | 申请日: | 2016-09-30 |
公开(公告)号: | CN108369659B | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 李·蔡;J·S·蒂特里克;徐萌;M·D·舒尔兹;王川;N·提尔曼斯;M·布拉舒斯托威克茨 | 申请(专利权)人: | 扎斯特有限公司 |
主分类号: | G06N3/02 | 分类号: | G06N3/02 |
代理公司: | 深圳市百瑞专利商标事务所(普通合伙) 44240 | 代理人: | 金辉 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 具有 目标 性质 实体 系统 方法 | ||
提供了用于在不测量性质的情况下针对所述性质测定测试实体的系统和方法。示例性测试实体包含蛋白质、蛋白质混合物和蛋白质片段。针对多个参考实体中的每个参考,获得作为训练数据的N维空间的对应子集中的第一特征的测量结果和M维空间的对应子集中的第二特征的测量结果。所述第二特征中的一个或多个是目标性质的度量。使用特征选择来识别第一特征子集或其组合。使用所述训练数据来在所述第一特征子集上训练模型。运用所述测试实体的所述第一特征子集的测量值,从而获得模型值,所述模型值与使用来自显示所述性质的参考实体的所述第一特征子集的测量值获得的模型值进行比较。
相关申请的交叉引用
本申请要求于2015年9月30日提交的、发明名称为“用于食品应用的机器学习网络”的美国临时申请号62/235,174和于2016年9月29日提交的、发明名称为“用于识别具有目标性质的实体的系统和方法”的美国临时申请号62/401,787的优先权,其各自通过引用结合在此。
技术领域
本发明涉及机器学习模型,所述机器学习模型部分基于植物化合物的基本生化和/或理化和功能性质来预测植物化合物对食品应用的适宜性。
背景技术
植物由各种有机成分(如蛋白质、碳水化合物、脂质、天然产品和代谢物)组成。据估计,自然界中有约180亿种植物蛋白质(假设40万个植物种类并且每个种类45000种蛋白质)。即使限制到2万多种栽培植物,仍然产生9亿种蛋白质。即使使用现代高通量技术,这一庞大数量仍对测定可能的食品应用提出了重大挑战。更复杂的是,这些化合物中的一些化合物可能在组合中最有用,由此导致可能性的爆炸组合。比如,在有限的栽培植物组内,两种蛋白质组合可能有405×1015种并且三种蛋白质组合可能有121×1027种。
当前的食品开发方法无法利用令人满意的方式来有效地筛选植物中的可能用作食品配料的大量蛋白质和其他组分。这些配料在新或现有消费者食品产品中具有商业用途。比如,不存在植物成分用于食品应用中的综合数据。此外,虽然存在可以用于从植物中筛选可能用作食品配料的提取物的各种分子和功能测定,但许多这种测定很难执行并且完全无法切实在对来自植物的大量可能实体(如蛋白质)组合的可观部分进行采样的规模上使用。
因此,需要用于调查来自植物的实体的广阔空间和从此来源中识别用于食品应用的期望实体的系统和方法。
发明内容
本公开解决了本领域中调查从植物获得的实体的关阔空间以及从此来源中选择用于食品应用的期望实体的需求。本公开使用唯一受监督回归模型、受监督分类模型和/或无监督模型来识别提供关于由实体显示的目标性质是否存在或程度的信息的实体的特征。使用从训练集的参考实体测量的特征测量数据来训练包括多个参考实体的训练集。此训练集受限于尺寸并且因此多个分子测定和更多复杂功能测定可以在训练集中的每个参考实体上运行以便获得训练集的参考实体的多个分子特征和功能特征的值。分子特征的测量值不直接告知训练集中的参考实体是否具有目标性质或训练集的参考实体具有目标性质的程度。另一方面,功能特征的测量值提供用于判定训练集的特定参考实体是否具有目标性质的基础。比如,在一些实施例中,跨训练集的参考实体的功能特征的测量值与测试群体的成员是否具有目标性质和/或具有目标性质的程度相关。来自训练集中的每个参考实体的经测量的分子和功能测量数据用于使用受监督或无监督技术来训练模型,由此有利地推导出模型,所述模型识别测量的分子特征的至少一个子集与训练群体中的参考实体是否具有目标性质和/或具有目标性质的程度之间的关系。由于这一情况,训练的模型可以用于快速测试测试实体是否具有目标性质和/或具有目标性质的程度。也就是说,在没有在测试实体上运行功能测定的任何要求的情况下,可以针对测试实体是否具有目标性质和/或具有目标性质的程度而快选筛选测试实体。另外,在一些实施例中,模型训练结合数据降维技术以便限制在模型训练中使用的分子特征的数量以及由此每个测试实体的需要测量的分子特征的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扎斯特有限公司,未经扎斯特有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680067948.6/2.html,转载请声明来源钻瓜专利网。