[发明专利]用于分布外检测的似然比在审
申请号: | 202080047730.0 | 申请日: | 2020-05-26 |
公开(公告)号: | CN114127747A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 任洁;乔舒亚·文森特·迪隆;彼得·俊腾·刘;埃米莉·阿曼达·费尔蒂格;巴拉吉·拉克什米纳拉亚南;罗兰德·贾斯珀·斯诺埃克;瑞安·波普兰;马克·安德鲁·德普里斯托 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06N7/00 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 邓聪惠;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 分布 检测 | ||
1.一种执行分布外检测的计算系统,所述计算系统包括:
一个或多个处理器;以及
一种或多种非暂时性计算机可读介质,所述一种或多种非暂时性计算机可读介质共同地存储:
在包括作为分布的样本的多个分布内训练示例的分布内训练数据集上训练的机器学习生成语义模型,所述机器学习生成语义模型被配置成接收并处理数据输入以生成所述数据输入的第一似然值,所述第一似然值作为所述数据输入是来自所述分布的样本的似然度的第一指示;
在包括多个背景训练示例的背景训练数据集上训练的机器学习生成背景模型,所述多个背景训练示例中的一个或多个背景训练示例是通过所述多个分布内训练示例中的一个或多个分布内训练示例的扰动而生成的,所述机器学习生成背景模型被配置成接收并处理所述数据输入以生成所述数据输入的第二似然值,所述第二似然值作为所述数据输入是来自背景分布的样本的似然度的第二指示;以及
指令,当由所述一个或多个处理器执行时,所述指令使所述计算系统执行操作,所述操作包括:
至少部分地基于由所述机器学习生成语义模型生成的所述第一似然值和由所述机器学习生成背景模型生成的所述第二似然值来确定所述数据输入的似然比值;以及
至少部分地基于所述似然比值来预测所述数据输入是否是分布外输入。
2.根据权利要求1所述的计算系统,其中,确定所述数据输入的所述似然比值包括确定所述第一似然值除以所述第二似然值的对数。
3.根据任一项前述权利要求所述的计算系统,其中,至少部分地基于所述似然比值来预测所述数据输入是否是分布外输入包括:
将所述似然比值与阈值进行比较;以及
当所述似然比值小于所述阈值时预测所述数据输入是分布外输入。
4.根据任一项前述权利要求所述的计算系统,其中,所述操作进一步包括:
当预测到所述数据输入不是分布外输入时,将所述数据输入提供给机器学习分类器模型以相对于多个分布内类进行分类。
5.根据任一项前述权利要求所述的计算系统,其中,扰动所述一个或多个分布内训练示例以生成所述一个或多个背景训练示例包括向所述一个或多个分布内训练示例添加噪声。
6.根据任一项前述权利要求所述的计算系统,其中,所述数据输入包括基因组序列。
7.根据任一项前述权利要求所述的计算系统,其中,所述一个或多个分布内训练示例中的每一个分布内训练示例包括DNA字符的相应基因组序列,并且扰动所述一个或多个分布内训练示例以生成所述一个或多个背景训练示例包括将DNA字符的每个相应基因组序列的一个或多个字符随机地突变为一个或多个替代DNA字符。
8.根据任一项前述权利要求所述的计算系统,其中,所述机器学习生成语义模型和所述机器学习生成背景模型中的一个或两个包括循环神经网络。
9.根据任一项前述权利要求所述的计算系统,其中,所述数据输入包括图像。
10.根据任一项前述权利要求所述的计算系统,其中,所述一个或多个分布内训练示例中的每一个分布内训练示例包括含有多个像素的相应图像,并且扰动所述一个或多个分布内训练示例以生成所述一个或多个背景训练示例包括,对于每个相应图像,随机地改变所述多个像素中的一个或多个像素的相应像素值。
11.根据任一项前述权利要求所述的计算系统,其中:
所述多个分布内训练示例中的每一个分布内训练示例包括与和所述分布内训练数据集相关联的多个分布内类中的至少一个分布内类有关的语义内容;以及
扰动所述一个或多个分布内训练示例以生成所述一个或多个背景训练示例破坏包括在所述一个或多个分布内训练示例中的所述语义内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080047730.0/1.html,转载请声明来源钻瓜专利网。