[发明专利]一种基于语音的多通道手写中文纠错方法无效

申请号：	200810116585.8	申请日：	2008-07-11
公开（公告）号：	CN101315666A	公开（公告）日：	2008-12-03
发明（设计）人：	戴国忠;敖翔;田丰;姜映映;王宏安	申请（专利权）人：	中国科学院软件研究所
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/34;G10L15/10
代理公司：	北京君尚知识产权代理事务所	代理人：	余长江
地址：	100190北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于语音通道手写中文纠错方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于语音的多通道手写中文纠错方法，其步骤包括：

1)同时进行笔迹和语音输入；

2)将所述笔迹过切分为多个片断序列，得到笔迹所有的过切分结果，所述片段为汉字的最小切分段；

3)将笔迹和语音表示成音素序列，利用音素间的相似度，计算所述笔迹片段序列对应的所有过切分的音素序列与语音音素序列的Levenshtein距离；

4)利用所述Levenshtein距离计算笔迹片段序列和语音音素序列的分治融合代价；根据最小分治融合代价对应的过切分位置，获得正确的手写中文。

2.如权利要求1所述的基于语音的多通道手写中文纠错方法，其特征在于，步骤2)中，所述过切分方法为：

1)将所有笔迹过切分的片断序列F＝f₀f₁...f_T-1组织成有向图G；所述有向图中的顶点为各个片段序列{f₀，f₁，...，f_T-1}和一个附加顶点f_T，所述f_i代表一个片断，T表示片段的序列长度；

2)按如下公式找到所有的过切分结果：

3.如权利要求1所述的基于语音的多通道手写中文纠错方法，其特征在于，步骤3)中，所述笔迹的音素表示通过查字典的方式获得；所述语音的音素表示由语音识别器获得。

4.如权利要求1所述的基于语音的多通道手写中文纠错方法，其特征在于，步骤3)中，所述过切分的音素序列的Levenshtein距离的计算是通过将替换操作的代价用音素序列间的相似度表示。

5.如权利要求1所述的基于语音的多通道手写中文纠错方法，其特征在于，步骤3)中，所述音素间的相似度S(ph₁，ph₂)＝sIn(in₁，in₂)+sFn(fn₁，fn₂)，其中ph表示音素，in表示音素的声母，fn表示音素的韵母。

6.如权利要求1所述的基于语音的多通道手写中文纠错方法，其特征在于，步骤4)中，所述笔迹片段序列和语音音素序列的分治融合代价的计算方法如下：

1)当笔迹过切分的片断序列F_i，j的长度小于预先设定的阈值threshold时，穷举策略的融合代价ExFusion(F_i，j，PH_k，l)为上述笔迹片段序列F_i，j对应的所有过切分的音素序列PH_hw与语音音素序列PH_k，l的Levenshtein距离LD(PH_hw，PH_k，l)的最小值；

2)笔迹过切分的片断序列长度大于设定阈值threshold时，计算F_i，j在笔迹的过切分位置p的过切分代价DCCost(p，F_i，j，PH_k，l)，选择其最小值，递归得到所述分治融合代价DCFusion(Fi,j,PHk,l)=ExFusion(Fi,j,PHk,l),ifj-i<thresholdmint-1≤p≤t+1(DCCost(p,Fi,j,PHk,l)),else,]]>

t＝(i+j)/2，其中，DCCost(p,Fi,j,PHk,l)=mink≤q≤lDCFusion(Fi,p,PHk,q)+DCFusion(Fp+1,j,PHq+1,l),]]>

q为在语音音素序列的位置，k≤q≤l。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所，未经中国科学院软件研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810116585.8/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于语音的多通道手写中文纠错方法无效

专利文献下载