[发明专利]自动打印语言检测算法在审
申请号: | 201810171191.6 | 申请日: | 2018-03-01 |
公开(公告)号: | CN108536399A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | R.Y.R.高 | 申请(专利权)人: | 大数据奥尼尔公司 |
主分类号: | G06F3/12 | 分类号: | G06F3/12;G06F17/27 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 张健;蒋骏 |
地址: | 美国佛*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 打印 语法模式 迭代 语言 检测算法 语言特定 自动打印 标识打印 符号组合 决策函数 数据样本 自动语言 检测 感测 匹配 搜索 重复 应用 | ||
1.一种用于打印语言检测的方法,包括:
(a)选择数据流;
(b)针对对于一种或多种打印语言特有的第一符号和/或符号组合搜索所述数据流;
(c)将搜索的结果用于第一符号和/或符号组合以确定用于下一步的指令;
(d)针对接下来的符号和/或符号组合重复(b)-(c),直到获得对于打印语言的检测足够的阈值量的特有语言特征为止;和
(e)将检测到的特有特征用于标识打印语言。
2.根据权利要求1所述的方法,其中搜索所述数据流还包括使用由最终用户输入的一个或多个附加配置。
3.根据权利要求1所述的方法,其中搜索所述数据流还包括使用由开发者输入的一个或多个附加配置。
4.根据权利要求1所述的方法,还包括同时针对两个或更多个符号和/或符号组合进行搜索,每个对于特定语言是特有的。
5.根据权利要求1所述的方法,其中针对符号组合进行搜索包括针对打印命令进行搜索。
6.一种用于自动语言感测的方法,包括:
接收具有与对于特定打印语言特定的语法模式对应的一个或多个打印符号的数据样本;
迭代地标识打印符号,检测打印符号与一种或多种打印语言的预定语法模式之间的对应,并且将决策函数应用于每个随后的迭代;和
重复所述迭代标识,直到通过将所述一个或多个打印符号与对于所标识的打印语言特定的预定语法模式相匹配而检测到一种或多种打印语言为止。
7.根据权利要求6所述的方法,还包括检测所述数据样本的结束。
8.根据权利要求7所述的方法,还包括在达到所述数据样本的结束之后重新开始所述语言感测。
9.根据权利要求6所述的方法,还包括当达到预定的超时阈值时重新开始所述语言感测。
10.根据权利要求6所述的方法,还包括当检测到错误时重新开始所述语言感测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大数据奥尼尔公司,未经大数据奥尼尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810171191.6/1.html,转载请声明来源钻瓜专利网。