[发明专利]语音识别和笔划识别相结合的输入方法及其终端无效
申请号: | 200710146271.8 | 申请日: | 2007-08-31 |
公开(公告)号: | CN101377726A | 公开(公告)日: | 2009-03-04 |
发明(设计)人: | 王珩;周卫 | 申请(专利权)人: | 西门子(中国)有限公司 |
主分类号: | G06F3/048 | 分类号: | G06F3/048;G10L15/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100102北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 笔划 相结合 输入 方法 及其 终端 | ||
技术领域
本发明涉及字符输入领域,具体的讲是语音识别和笔划识别相结合的输入方法及其终端。
背景技术
目前,移动终端和移动通信终端都能够输入文字,随着社会生活节奏的加快,就更需要在移动终端和移动通信终端上进行更加快速的文字输入。通常,可以通过语音输入或者笔划识别来进行文字信息的输入。
但是目前有很多原因阻碍语音识别技术的发展,例如:说话者的第一语言对该说话者的第二语言有一定的不利影响,一般来说第一语言为当地带口音的语言,例如方言;第二语言为不带口音的语言,例如普通话。由于方言的影响,使说话者在说第二语言时会产生发音不准的问题。由于地域的不同和民族的不同,口音和方言的存在,使语音识别十分困难,在语音识别中构造数目庞大的识别单词库是一种解决办法,但是单词库的增大一方面对于嵌入式设备的存储能力是一种挑战,另一方面由于搜索网络过于庞大,导致系统效率下降,从而也会影响识别的准确性。近年来在语音识别技术上有了很大的发展,但是依然无法使操作者完全信任语音识别技术。
如果在现有语音识别系统中输入具有口音的普通话,那么就会使识别结果有很大的不确定性。现有技术中也具有一些能够部分克服上述不足的方案,可以通过例如中国专利95195955.7一种语音识别所述,通过记录使用者的发音特征来对语音信息进行识别。但是对于每个不同的使用者来说,在具有较重口音的情况下,使用上述语音识别方案的结果还不是很理想。
另一方面,噪音的干扰使得语音识别结果也不是十分的理想。在实验室开发的语音识别系统,在现实环境中例如,应用于移动通信终端,应用于火车站、汽车等,会比在实验室中的识别效果差很多。造成上述识别效果不佳的原因在于,真实环境中不可预测的噪音会使采集的语音数据与预先在语音识别系统中训练的语音数据不匹配。
目前的语音识别系统都是嵌入式的系统结构,作为终端输入的一种方式,例如在手机上增加语音识别系统用于文字输入,但是由于语音识别的效果并不够理想,所以候选文字结果太多,使得输入效率不高。
另一种移动终端的输入方式为手写或者通过键盘的笔划输入,其中中文字符的手写输入识别可以被分为两类,一类是在线的手写输入识别,另一种是线下手写输入识别(OCR:光学字符识别),其中后一种主要用于扫描识别。对于第一种手写输入识别技术来说,需要一种特殊的界面用于文字的输入,该界面收集用户输入的笔划顺序,方向和形状信息,并将该信息传送给与其相联接的计算机,由计算机对用户的输入进行分析并最终输出与用户输入笔划相近的中文字符。目前有很多手写识别技术,例如中国专利98106953.3一种手写汉字识别方法及装置中所述,针对用户每一笔的输入进行识别和匹配,用户不需要输入文字的全部笔划就可以匹配出希望的文字。但是目前的笔划输入识别技术中存在以下问题:中文字符数量比较多,常用的大概3000-4000个,汉字编码的国家标准GB2312-80包括6763个字符;每个中文字符都有不同的字体,每个中文字符都有相对比较复杂的结构,平均每个字符都有很多笔划组成,最多的字符甚至具有36个笔划,完全按照笔划进行识别的识别率并不是很高,影响其广泛的应用。并且不同意义的中文字符可能具有相近的结构,例如,“”人、“入”,“已”、“己”、“巳”等等。书写中文字符时笔划的变形,例如笔划点写成笔划捺等;字体结构的扭曲,例如“曰”字写成“日”字等;草书等字体,都会影响字符的识别。
发明内容
本发明为了解决以上现有技术中的不足,提供了一种语音和笔划相结合的输入方法,避免了因为用户的读音错误或不准导致输入的效率低的问题,并且能够提高输入准确度。
本发明提供一种语音和笔划相结合的输入终端,使用户在移动终端上输入的速度和准确性得到很大提高。
语音输入和笔划输入相结合的文字输入方法,包括,
步骤1,接收用户的语音输入信息;还包括,
步骤2,对所述语音输入信息进行语音识别,在语音数据库中匹配所述语音输入信息的识别结果,将所有匹配的文字结果作为语音候选文字序列进行显示,将该语音候选文字序列存储于存储器中;
步骤3,接收用户的至少一个笔划输入信息;
步骤4,对所述笔划输入信息进行笔划识别,在所述语音候选文字序列的文字范围内用所述笔划来匹配所述笔划输入信息的识别结果,将匹配的文字结果作为笔划候选文字序列进行显示;
步骤5,如果用户选择所述笔划候选文字序列中的某个候选文字结果,则将该候选文字结果显示于屏幕中,并结束输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子(中国)有限公司,未经西门子(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710146271.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种杨桉复合板
- 下一篇:一种园林施工专用的电动锯