[发明专利]用于手写文本的自动语言检测的系统和方法在审
申请号: | 201980036282.1 | 申请日: | 2019-05-13 |
公开(公告)号: | CN112204506A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 涂霄;王喆 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06F3/0488;G06F3/0354;G06F40/263;G06F40/284;G06K9/00;G06K9/22;G06K9/68;G06N5/04 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 黄倩 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 手写 文本 自动 语言 检测 系统 方法 | ||
1.一种语言检测系统,包括:
处理系统,包括一个或多个处理器;以及
存储器,被配置为存储要由所述一个或多个处理器执行的程序代码,所述程序代码包括:
输入分析器,被配置为:
从输入接口接收手写输入,所述手写输入包括一个或多个书写笔画;
将所述手写输入与坐标时间对集合相关联;以及
至少基于所述坐标时间对集合将所述手写输入分组为单词;检测管理器,被配置为:
对与所述单词相对应的所述一个或多个书写笔画进行规范化以生成经规范化的单词;
单独地变换所述经规范化的单词以针对所述经规范化的单词生成语言向量;以及
至少基于所述语言向量确定至少一个语言概率,以选择特定语言识别引擎;以及
引擎选择器,被配置为:
将所述手写输入提供给多个语言识别引擎中的所述特定语言识别引擎,以确定与所述手写输入相关联的语言。
2.根据权利要求1所述的语言检测系统,其中所述检测管理器被配置为使用递归神经网络(RNN)单独地分析所述经规范化的单词以针对所述经规范化的单词生成所述语言向量,其中所述语言向量是所述RNN的输出。
3.根据权利要求2所述的语言检测系统,其中所述RNN是双向RNN,所述双向RNN从所述双向RNN的前向部分生成第一向量并且从所述双向RNN的后向部分生成第二向量;并且
其中所述检测管理器被配置为级联所述第一向量和所述第二向量以生成所述语言向量。
4.根据权利要求1所述的语言检测系统,其中所述书写笔画中的每个书写笔画包括所述坐标时间对集合中的一个或多个坐标时间对集合;
其中所述输入分析器被配置为:
至少基于所述一个或多个坐标时间对集合将所述一个或多个书写笔画中的每个书写笔画与所述一个或多个书写笔画中的其他书写笔画的空间和时间属性进行比较;以及
至少基于所述空间和时间属性将所述手写输入分组为单词;并且
其中所述空间和时间属性包括以下至少一项:
连续单词相对于先前单词的方向;
所述一个或多个书写笔画之间的时间量;
完成书写笔画所花费的时间量;或者
所述一个或多个书写笔画中的书写笔画与其他书写笔画的接近度。
5.根据权利要求1所述的语言检测系统,其中所述手写输入包括近似实时地捕获的手写笔画,并且其中所述输入接口包括用户接口,所述用户接口是触摸屏、触摸板或相机中的一项或多项;或者
其中所述手写输入包括存储的手写表示,并且其中所述输入接口包括到所述表示被存储的存储装置的访问接口。
6.根据权利要求1所述的语言检测系统,其中所述输入分析器被配置为:
检测所述手写输入中的符号;以及
将检测到的所述符号提供给所述检测管理器以确定所述至少一个语言概率。
7.根据权利要求1所述的语言检测系统,还包括:
被配置为以下的所述特定语言识别引擎:
生成所述手写输入的语言转换或转录;以及
用户接口,被配置为:
将由所述特定语言识别引擎生成的所述手写输入的所述语言转换或所述转录提供给显示器。
8.一种用于语言检测的计算机实现的方法,所述方法包括:
从输入接口接收手写输入,所述手写输入包括一个或多个书写笔画;
至少基于与所述手写输入相对应的坐标时间对集合将所述手写输入分组为单词;
单独地变换所述单词以针对所述单词生成语言向量;
至少基于所述语言向量确定至少一个语言概率,以选择特定语言识别引擎;以及
将所述手写输入提供给多个语言识别引擎中的特定语言识别引擎,以确定与所述手写输入相关联的语言。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980036282.1/1.html,转载请声明来源钻瓜专利网。