[发明专利]学习数据过滤在审

专利信息
申请号: 201780048808.9 申请日: 2017-08-02
公开(公告)号: CN109564588A 公开(公告)日: 2019-04-02
发明(设计)人: R·辛格;S·古尔瓦尼;王新宇 申请(专利权)人: 微软技术许可有限责任公司
主分类号: G06F17/24 分类号: G06F17/24
代理公司: 北京市金杜律师事务所 11256 代理人: 王茂华
地址: 美国华*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 过滤 表达式集合 交集 有向无环图 结果集合 学习数据 用户提供 不一致 生成器 数据项 减法 减去 运算 创建
【权利要求书】:

1.一个或多个计算机可读介质,存储计算机可执行指令,所述计算机可执行指令在由第一计算机的一个或多个处理器执行时,使得所述一个或多个处理器执行动作,所述动作包括:

接收来自字符串列表的一个或多个正字符串例的标识;

创建分别与所述正字符串例相对应的正有向无环图(DAG)的列表,每个正DAG表示一个或多个第一令牌序列,所述一个或多个第一令牌序列限定与对应的所述正字符串例一致的相应字符模式;

接收来自所述字符串列表的一个或多个反字符串例的标识;

创建分别与所述反字符串例相对应的反DAG,每个反DAG表示一个或多个第二令牌序列,所述一个或多个第二令牌序列限定与对应的所述反字符串例一致的相应字符模式;

特定的DAG具有包括一个或多个开始节点(602(b))和一个或多个结束节点(602(c))的节点,并且具有在所述节点之间的一个或多个有向边,其中每个有向边具有一个或多个令牌的相关联集合;以及

针对每个正DAG,从所述正DAG中减去每个反DAG。

2.根据权利要求1所述的一个或多个计算机可读介质,其中所述第一令牌序列包括在可用令牌集合之中的令牌,所述方法进一步包括:

向所述可用令牌集合中的每个可用令牌分配排序值;

至少部分地基于所述令牌序列中的所述令牌的所述排序值,来对由特定的正DAG表示的每个令牌序列进行排序;以及

至少部分地基于由所述特定的正DAG表示的所述令牌序列的所述排序,来选择由所述特定的正DAG表示的所述令牌序列中的一个令牌序列。

3.根据权利要求1-2中任一项所述的一个或多个计算机可读介质,所述动作进一步包括:

从所述字符串列表接收附加正字符串例的标识;

创建与所述附加正字符串例相对应的附加正DAG;以及

从所述附加正DAG中减去每个反DAG。

4.根据权利要求1-3中任一项所述的一个或多个计算机可读介质,所述动作进一步包括:

从所述字符串列表接收附加反字符串例的标识;

创建与所述附加反字符串例相对应的附加反DAG;以及

从每个正DAG中减去所述反DAG。

5.根据权利要求1-4中任一项所述的一个或多个计算机可读介质,其中所述减去包括:关于第一DAG的第一节点和第二节点以及第二DAG的第三节点和第四节点,所述第一节点和所述第二节点与所述第一DAG的第一边相对应,所述第三节点和所述第四节点与所述第二DAG的第二边相对应,所述第一边具有相关联的第一令牌集合,并且所述第二边具有相关联的第二令牌集合:

复制所述第二节点以在所述第一DAG中创建新节点;

如果所述第二节点是结束节点,将所述新节点设置为结束节点;

向所述第一DAG添加从所述第一节点到所述新节点的新边;

计算第三令牌集合,所述第三令牌集合包括第一令牌集合与第二令牌集合的交集;

将所述第一令牌集合与所述新边相关联;

从所述第一令牌集合中移除所述第三令牌集合;以及

如果所述第四节点是结束节点,将所述新节点设置为非结束节点。

6.一种方法,包括:

从字符串列表接收正字符串例的标识;

确定与所述正字符串例相对应的一个或多个对应的第一令牌序列,所述第一令牌序列限定与所述正字符串例一致的相应字符模式;

接收来自所述字符串列表的反字符串例的标识;

确定与所述反字符串例相对应的一个或多个第二令牌序列,所述第二令牌序列限定与所述反字符串例一致的相应字符模式;

从所述第一令牌序列中移除所述一个或多个第二令牌序列,以创建第一令牌序列集合;

选择所述第一令牌序列集合中的一个或多个令牌序列;以及

从所述字符串列表产生字符串的结果集合,其中所述结果集合中的每个字符串与所选择的所述一个或多个令牌序列中的至少一个令牌序列一致。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201780048808.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top