[发明专利]具有匹配数据报告模块的型式辨识处理器有效
申请号: | 200980154031.X | 申请日: | 2009-12-15 |
公开(公告)号: | CN102272714A | 公开(公告)日: | 2011-12-07 |
发明(设计)人: | J·托马斯·帕夫洛夫斯基 | 申请(专利权)人: | 美光科技公司 |
主分类号: | G06F7/02 | 分类号: | G06F7/02 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 宋献涛 |
地址: | 美国爱*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 匹配 数据 报告 模块 型式 辨识 处理器 | ||
技术领域
本发明的实施例一般来说涉及电子装置,且更具体来说在某些实施例中涉及具有型式辨识处理器的电子装置。
背景技术
在计算领域中,型式辨识任务越来越具有挑战性。计算机之间传输的数据量不断增大,且用户希望识别的型式数目日益增加。举例来说,通常通过搜索数据流中的型式(例如,特定短语或代码片段)来检测垃圾邮件及恶意软件。型式的数目随着垃圾邮件及恶意软件的变化而增加,因为可实施新型式以搜索新变体。搜索数据流以找到这些型式中的每一者可形成计算瓶颈。通常,在接收到数据流时,搜索数据流以一次一个地找到每一型式。在系统准备搜索数据流的下一部分之前的延迟随着型式数目而增加。因此,型式辨识可使数据的接收减慢。
当检测到型式时,检查匹配所述型式的数据通常为有用的。然而,再现所述匹配数据可为困难的。搜索可规定允许数据流的任意长的部分产生匹配的通配符字符或其它运算子。此外,不同型式的部分可由数据流的相同部分匹配,而不同型式可在不同时间开始及停止。每当数据流开始匹配型式中的一者时创建所述数据流的新副本为昂贵的,因为形成所述数据流的多个任意长的副本消耗大量存储器。
附图说明
图1描绘搜索数据流的系统的实例;
图2描绘图1的系统中的型式辨识处理器的实例;
图3描绘图2的型式辨识处理器中的搜索项单元的实例;
图4及图5描绘图3的搜索项单元搜索数据流以找到单个字符;
图6到图8描绘搜索数据流以找到一词的包含数个搜索项单元的辨识模块;
图9描绘经配置以搜索数据流以并行找到两个词的辨识模块;
图10到图12描绘根据规定具有同一前缀的多个词的搜索准则进行搜索的辨识模块;
图13图解说明根据本发明技术的实施例的匹配数据报告模块的实施例;且
图14到图19图解说明图13的匹配数据报告模块根据本发明技术的实施例操作。
具体实施方式
图1描绘搜索数据流12的系统10的实例。系统10可包含型式辨识处理器14,其根据搜索准则16搜索数据流12。
每一搜索准则可规定一个或一个以上目标表达(即,型式)。短语“目标表达”是指型式辨识处理器14正在搜索的数据序列。目标表达的实例包含拼写某一词的字符序列、详细说明基因的遗传碱基对序列、形成图像的一部分的图片或视频文件中的位序列、形成程序的一部分的可执行文件中的位序列或形成歌曲或口语短语的一部分的音频文件中的位序列。
搜索准则可规定一个以上目标表达。举例来说,搜索准则可规定以字母序列“cl”开始的所有五个字母的词、以字母序列“cl”开始的任一词、包含词“cloud”三次以上的段落等。可能目标表达集合的数目为任意大的,例如,可存在与数据流可呈现的数据排列同样多的目标表达。搜索准则16可以各种格式来表达,包含正则表达、简明地规定若干目标表达集合而不必列举每一目标表达的程序设计语言。
每一搜索准则可由一个或一个以上搜索项构造而成。因此,搜索准则的每一目标表达可包含一个或一个以上搜索项且一些目标表达可使用共用搜索项。如本文中所使用,短语“搜索项”是指在单个搜索循环期间所搜索的数据序列。所述数据序列可包含呈二进制格式或其它格式(例如,十进制、ASCII等)的多个数据位。所述序列可用单个数字或多个数字(例如,数个二进制数字)编码数据。举例来说,型式辨识处理器14可一次一个字符地搜索文本数据流12,且搜索项可规定具有单个字符的集合,例如,字母“a”,字母“a”或“e”,或规定具有所有单个字符的集合的通配符搜索项。
搜索项可小于或大于规定字符(或数据流所表达的信息的其它语义符—即,基本单位,例如,音符、遗传碱基对、10进制数字或子像素)的位的数目。举例来说,搜索项可为8个位且单个字符可为16个位,在此情况下,两个相连搜索项可规定单个字符。
搜索准则16可由编译器18格式化以用于型式辨识处理器14。格式化可包含从所述搜索准则解构出搜索项。举例来说,如果数据流12所表达的语义符大于所述搜索项,那么所述编译器可将搜索准则解构成多个搜索项以搜索单个语义符。类似地,如果数据流12所表达的语义符小于所述搜索项,那么编译器18可为每一单独语义符提供具有未使用位的单个搜索项。编译器18还可对搜索准则16进行格式化以支持型式辨识处理器14本机不支持的各种正则表达运算子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美光科技公司,未经美光科技公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980154031.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置