[发明专利]自动打印语言检测算法在审
申请号: | 201810171191.6 | 申请日: | 2018-03-01 |
公开(公告)号: | CN108536399A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | R.Y.R.高 | 申请(专利权)人: | 大数据奥尼尔公司 |
主分类号: | G06F3/12 | 分类号: | G06F3/12;G06F17/27 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 张健;蒋骏 |
地址: | 美国佛*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 打印 语法模式 迭代 语言 检测算法 语言特定 自动打印 标识打印 符号组合 决策函数 数据样本 自动语言 检测 感测 匹配 搜索 重复 应用 | ||
本发明涉及自动打印语言检测算法。一种用于自动语言感测的方法包括:接收具有与对于特定打印语言特定的语法模式对应的一个或多个打印符号的数据样本;迭代地标识打印符号,检测打印符号与一种或多种打印语言的预定语法模式之间的对应,并且将决策函数应用于每个随后的迭代;和重复迭代标识,直到通过将一个或多个打印符号与对于所标识的打印语言特定的预定语法模式相匹配而检测到一种或多种打印语言为止。该方法可以包括同时针对两个或更多个符号和/或符号组合进行搜索,每个对于特定语言是特有的。
技术领域
本发明涉及打印语言,并且更具体地涉及自动语言检测。
背景技术
一般而言,各种各样的打印语言目前可在市场上获得,并且必须以快速和方便的方式支持这些语言中的每一种。此外,可以同时使用多于一种打印语言。为了支持可能具有相似或不同语法模式的不同打印语言,需要高效的语言检测算法。
语言检测的标准算法缺乏符号识别灵活性。例如,由Ferlitsch的美国专利号8,218,187公开了一种用于成像设备的自动语言切换的方法,但是然而不会让用户例如通过调整决策树的节点来配置检测算法。由Bringmann的美国专利号5,293,466公开了一种打印机,其能够通过使用加权模式矢量的树来解释不同打印语言的打印作业。尽管该参考文献公开了用于使用户提供附加属性以改进检测的准确度的选项,但不提供用于利用不同逻辑和检查来配置算法的每个节点的选项。在由Even等人的美国专利号5,960,113中公开了一种自动语言识别方法。该方法以预定顺序次序针对语言进行搜索,并且不涉及具有可配置节点的决策树算法。此外,尽管该参考文献提供了基于语法错误的检测来重新开始语言识别过程,但不提供基于打印作业命令的结束来重新开始该过程。由Toshihiro的日本专利号08,331,306公开了一种打印机,其接收来自主计算机的用于选择打印机语言并分析打印数据以形成图像的命令,但是不提供用于在输入数据流在预定的时间段内没有被检测到的情况下重新开始打印语言检测程序的选项。Datamax E-Class打印机操作员手册公开了一种具有预定超时的自动感测的方法,但是不提供在当前数据流的结束处的自动感测和语言检测。由Campbell等人的美国专利号5,555,435公开了一种标识作业边界的结束并相应地标识下一个打印机语言的语言的方法,这以确定输入数据的每个样本是否具有与当前语言相同的语言开始。
因此,存在针对灵活的自动语言检测算法的需要,该算法能够通过在决策树的每个节点上应用决策函数来支持各种打印语言。
发明内容
因此,本发明包括基于应用决策树算法的自动语言检测。
在示例性实施例中,一种用于打印语言检测的方法包括:选择数据流,并且针对对于一种或多种打印语言特有(characteristic)的第一符号和/或符号组合进行搜索;使用搜索结果来确定用于下一步的指令;针对接下来的符号和/或符号组合重复操作,直到获得对于打印语言的检测足够的阈值量的特有语言特征为止;并且将检测到的特有特征用于标识打印语言。
在另一示例性实施例中,一种用于自动语言感测的方法包括:接收具有与对于特定打印语言特定的语法模式对应的一个或多个打印符号的数据样本;迭代地标识打印符号,检测打印符号与打印语言的预定语法模式之间的对应,并将决策函数应用于每个随后的迭代;并且重复迭代标识,直到通过将打印符号与对于所标识的打印语言特定的预定语法模式相匹配而检测到一种或多种打印语言为止。
在又一示例性实施例中,一种用于语法模式标识的方法包括:扫描数据样本以检测语法模式;将检测到的语法模式与一组数据库语言签名进行比较,并且选择用于下一步的搜索参数;重复扫描和比较过程,直到检测到的语法模式与数据库语言签名相匹配为止;并且将匹配的语言签名用于标识一种或多种打印语言。
在以下详细描述及其附图内进一步解释了前述说明性发明内容以及本发明的其他示例性目的和/或优点以及实现其的方式。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大数据奥尼尔公司,未经大数据奥尼尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810171191.6/2.html,转载请声明来源钻瓜专利网。