[发明专利]一种利用汉语数码语音输入计算机指令的方法及装置在审

专利信息
申请号: 201510128119.1 申请日: 2015-03-24
公开(公告)号: CN104679473A 公开(公告)日: 2015-06-03
发明(设计)人: 钟林 申请(专利权)人: 钟林
主分类号: G06F3/16 分类号: G06F3/16
代理公司: 代理人:
地址: 610016 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 利用 汉语 数码 语音 输入 计算机 指令 方法 装置
【说明书】:

1技术领域

发明公开一种利用汉语数码语音输入计算机指令的方法及装置,主要用于工业设备、交通设备、军事设备(以下统称重要设备)的精准语音操控,也用于各种智能手机、平板电脑、家用电器和可穿戴设备的语音操控,属于信息通信技术领域。

2背景技术

对重要设备进行精准语音控制,需要满足下列要求:

第一,准确性。重要设备的语音控制指令识别精准度必须达到100%,不允许出现任何误操作。

第二,实时性。重要设备的语音控制指令必须实时发出,不允许出现任何延迟操作。

第三,简短性。重要设备的语音控制指令必须简短明确,不允许出现任何含糊冗长指令。

第四,抗噪性。重要设备的语音控制指令必须发音洪亮清晰,与环境噪音有着显著区别。

第五,极端性。重要设备的语音控制指令必须适应各种极端环境条件(如网络中断、人员负伤等)。

基于下列原因,汉语语音(指包括汉语拼音全部音节)控制技术无法满足上述要求,因而难以应用在重要设备上。

第一,汉语语音识别无论如何努力都做不到100%的识别率,这无疑是汉语语音技术应用于工业、交通、军事领域的一个最大痛点。

第二,汉语语音控制需要选择、确定、重复等复杂的步骤与操作,还要用手动方式发出语音指令起始信号和结束信号,这些都难以符合实时性要求。

第三,汉语同音字词多,识别率低,虽然通过一段话语来与重要设备进行交流能够大幅度提高识别率,却不符合简短性要求。

第四,汉语各个音节的识别率并不完全相同,一些单音节(如“a”“yi”“wu”)在噪声环境中识别率很低,不符合抗噪性要求。

第五,目前,在线汉语语音识别率已经达到很高的精准度,但在单机交互情景中,还达不到类似精准度,不符合极端性要求。

满足上述精准语音控制要求的充分必要条件是:

第一,必须最大限度地减少语音数量。语音数量愈多,识别难度就愈大,识别精准度就愈低,反之亦然。

第二,必须增加各个语音之间的区分度。各个语音之间的区分度愈高,识别精准度就愈高,反之亦然。

第三,必须采用统一、规范的语音控制指令格式,这样才能被计算机准确地识别,并且无需用手动方式发出语音指令起始信号和结束信号,让声控系统随时处于“待命”状态。

第四,必须彻底消除同音语音指令,即两个语音指令的发音不能相同或相近,否则容易引起误操作。

第五,必须能够校验语音指令的正确性,即通过增加一位用于校验的语音,让声控系统能够自动验证语音指令的正确性。

本发明人所研发的汉语数码语音指令系统,通过将汉语语音指令转换为数码语音指令,并对部分汉语数码读音所进行的修订,制定包括拼形规则、数码规则、语音规则、替代规则、校验规则、组合规则、导引规则在内的一整套汉语数码语音指令输入规则,使之满足了上述重要设备对语音控制的要求及其充分必要条件。

3发明内容

3.1将汉语语音指令转换为数码语音指令

将汉语语音指令转换为数码语音指令,依据的是基于《汉字拼形方案所形成的汉字拼形技术,这一技术的核心内容是将汉字看做是由八个汉字字母构成的。

将汉语语音指令转换为数码语音指令是分四步完成的:

第一步:从构成计算机指令的汉字中提取特征汉字字母,组成汉字字母指令,将汉字字符指令转换为汉字字母指令;

第二步:将汉字字母表示为数码,将汉字字母指令转换为汉字数码指令;

第三步:对汉字数码指令进行替换、校验、组合、导引,生成具有不同功能、应用于不同场合的汉字数码指令。

第四步:读出汉字数码指令,生成汉语数码语音指令。

汉语数码语音只有10个,而汉语语音则有1100多个(含四声),前者不足后者的百分之一。

汉字拼形技术提供了这样一种简单实用的转换方法,将由3000多个常用字组合而成的汉字字符指令转换为由8个数码组合而成的汉字数码指令,将由1100多个汉语语音组合而成的汉语语音指令转换为仅由10个汉语数码语音组合而成的汉语数码语音指令,而且这些汉字字符指令、汉字数码指令和汉语数码语音指令之间存在着一一对应关系。

附图4~附图6为《智能手机常用汉字数码指令表》,其中每个汉字字符指令与汉字数码指令之间都是一一对应的。

通过这一转换,即使采用通用算法,即利用汉语语音识别软件去识别汉语数码语音,其识别精准度也会大幅提升;若是采用专用算法,汉语数码语音的识别精准度要远远超过汉语语音的识别精准度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于钟林;,未经钟林;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510128119.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top