[发明专利]更新用于人工智能的训练示例在审
申请号: | 202080094068.4 | 申请日: | 2020-12-15 |
公开(公告)号: | CN115023695A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | J·S·克里希穆尔蒂;D·彼得斯;J·J·克劳斯曼 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 李光颖 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 更新 用于 人工智能 训练 示例 | ||
1.一种由计算系统执行的方法,所述计算系统运行程序指令以将先前注释的训练示例调整为用于训练人工智能系统的经更新的训练示例,所述方法包括:
识别查找表达;
识别替换表达;
识别过滤约束,所述过滤约束将所述先前注释的训练示例的子集与所述先前注释的训练示例中的其他训练示例区分开来;
基于所述过滤约束,在所述先前注释的训练示例中识别出的所述先前注释的训练示例的所述子集内识别所述查找表达的实例;
利用所述替换表达的实例替换在所述先前注释的训练示例的所述子集内识别出的所述查找表达的实例,以获得训练示例的经更新的子集;以及
输出所述训练示例的经更新的子集。
2.根据权利要求1所述的方法,还包括利用所述训练示例的经更新的子集来训练机器学习语言模型。
3.根据权利要求1所述的方法,其中,所述先前注释的训练示例的所述子集的训练示例包括利用包括所述查找表达的实例的程序片段标记的话语;以及
其中,所述训练示例的经更新的子集包括利用经更新的程序片段标记的所述话语,所述经更新的程序片段包括所述替换表达的实例,所述替换表达的实例替换所述查找表达的实例。
4.根据权利要求1所述的方法,其中,为了获得所述训练示例的经更新的子集,所述方法还包括:
在所述先前注释的训练示例的所述子集内识别所述查找表达的每个实例;以及
利用所述替换表达的实例替换在所述子集内识别出的所述查找示例的每个实例。
5.根据权利要求4所述的方法,还包括:
提供迁移预览接口,其通过在输出所述训练示例的经更新的子集之前利用所述替换表达的一个或多个实例替换所述查找表达的一个或多个实例,来呈现对所述先前注释的训练示例的所述子集的预览部分的改变。
6.根据权利要求1所述的方法,还包括:
基于所述过滤约束,在所述先前注释的训练示例中识别所述先前注释的训练示例的所述子集。
7.根据权利要求6所述的方法,其中,目标子区域包括标记所述先前注释的训练示例的话语的前导子区域或程序片段子区域。
8.根据权利要求6所述的方法,其中,所述过滤约束识别关键字和所述先前注释的训练示例的目标子区域;以及
其中,所述先前注释的训练示例的所述子集各自包括在所述子集的所述先前注释的训练示例的所述目标子区域内的所述关键字。
9.根据权利要求8所述的方法,其中,所述方法还包括在与所述目标子区域相关联的所述子集的所述先前注释的训练示例的不同子区域内利用所述替换表达的实例替换所述查找表达的实例。
10.根据权利要求9所述的方法,其中,所述目标子区域包括话语子区域;以及
其中,所述不同子区域包括所述话语子区域的注释子区域。
11.根据权利要求1所述的方法,还包括:
提供迁移接口,其中,识别所述查找表达、所述替换表达和所述过滤约束包括经由所述迁移接口接收定义所述查找表达、所述替换表达和所述过滤约束的用户输入。
12.根据权利要求11所述的方法,其中,所述迁移接口包括针对所述过滤约束可选择的策划过滤器的集合。
13.根据权利要求12所述的方法,其中,所述策划过滤器的集合包括过滤器的一个或多个子集,所述过滤器的一个或多个子集被应用于所述先前注释的训练示例的不同的相应子区域;
其中,向其应用所述过滤器的第一子集的第一子区域定义了包括输入话语和注释的注释对话的对话轮次。
14.根据权利要求1所述的方法,其中,所述查找表达包括通配符。
15.一种一个或多个计算设备的计算系统,所述计算系统包括:
逻辑机;以及
存储机,其保存指令,所述指令能由所述逻辑机运行以用于:
提供迁移接口,所述迁移接口包括查找表达字段、替换表达字段、以及一个或多个过滤约束工具的集合;
将查找表达识别为经由所述查找表达字段接收到的用户输入;
将替换表达识别为经由所述替换表达字段接收到的用户输入;
将过滤约束识别为经由所述过滤约束工具的集合接收到的用户输入,所述过滤约束将先前注释的训练示例的子集与所述先前注释的训练示例中的其他训练示例区分开来;
基于所述过滤约束,在先前注释的训练示例中识别先前注释的训练示例的所述子集;
在所述先前注释的训练示例的所述子集内识别所述查找表达的实例,所述先前注释的训练示例的所述子集的训练示例包括利用包括所述查找表达的实例的程序片段标记的话语;
利用所述替换表达的实例替换在所述先前注释的训练示例的所述子集内识别出的所述查找表达的实例,以获得训练示例的经更新的子集,所述训练示例的经更新的子集包括利用经更新的程序片段标记的所述话语,所述经更新的程序片段包括所述替换表达的实例;以及
输出所述训练示例的经更新的子集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080094068.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于检测生物分析物的传感器及其检测方法
- 下一篇:导尿管套件