[发明专利]用于离线语音识别的实时生成解码文件的系统和方法在审
申请号: | 202010323145.0 | 申请日: | 2020-04-22 |
公开(公告)号: | CN111724768A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 丁伟;谢世波;高亚龙;吴学伟;宋继海 | 申请(专利权)人: | 深圳市伟文无线通讯技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22;G10L15/26;G10L15/28;G10L15/30;G10L17/24 |
代理公司: | 深圳市深可信专利代理有限公司 44599 | 代理人: | 万永泉 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 离线 语音 识别 实时 生成 解码 文件 系统 方法 | ||
1.一种用于离线语音识别的实时生成解码文件的系统,其特征在于,包括:
命令词定义模块,该模块提供了唤醒词和命令词的定义以及词条检测功能;
命令词发音审核模块,该模块显示词条发音和修改词条发音;
串口命令定义模块,该模块定义命令词与系统之间的交互关系;
命令词门限定义模块,该模块定义命令词的门限值;
播报音配置模块,该模块设置识别出命令词后提示客户的播报音;
模型生成服务模块,该服务模块是根据上述五个模块提供的内容生成解码文件的服务模块;
用户管理服务模块,该服务模块具有用户的注册、审核、登录以及删除的服务功能。
2.根据权利要求1所述的一种用于离线语音识别的实时生成解码文件的系统,其特征在于:所述词条检测功能包括词的相似度检测以及词的发音检测。
3.根据权利要求1所述的一种用于离线语音识别的实时生成解码文件的系统,其特征在于:所述命令词发音审核模块会根据系统定义的词条生成每个词的发音,发音内容会显示到界面上。
4.根据权利要求1所述的一种用于离线语音识别的实时生成解码文件的系统,其特征在于:所述串口命令定义模块显示出定义的词条,在词条后面设有输入框,用于输入命令给系统;输入的命令系统会有检查功能,不可随意输入。
5.根据权利要求1所述的一种用于离线语音识别的实时生成解码文件的系统,其特征在于:对于所述命令词门限定义模块,每个识别出来的命令词都有一个可信度的值,当命令词的可信度值大于或等于设置的门限值时命令词有效,小于该门限值则被丢弃。
6.根据权利要求1所述的一种用于离线语音识别的实时生成解码文件的系统,其特征在于:所述播报音配置模块会让用户选择提示音的类型,所述播报音配置模块对上电后的播报音、唤醒词的播报音以及每个命令词的播报音都需要设置,设置的内容由用户手动输入,所述播报音配置模块在后台生成播放的语音文件。
7.根据权利要求1所述的一种用于离线语音识别的实时生成解码文件的系统,其特征在于:所述模型生成服务模块用以语音识别的解码模型生成、解码配置文件生成以及业务文件生成,并把所述一堆文件打包成镜像。
8.一种用于离线语音识别的实时生成解码文件的方法,其特征在于,包括以下步骤:
a.用户使用自己的用户名、密码登录到系统;
b.输入唤醒词和命令词,并进行系统检测,对于系统提示的词进行修改和调整;
c.查看命令词的发音,检查每个词条的发音是否正确,对不正确的发音进行修改;
d.对上电、唤醒词和命令词配置发送命令;
e.设置唤醒词和每个命令词的门限值,系统会给出默认门限值,用户根据产品的使用场景和特点来调整门限值;
f.配置上电播报音、唤醒后的播报音和命令词播报音;
g.点击生成解码镜像,用户下载镜像后放到硬件板子上以实现定制化的语音识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市伟文无线通讯技术有限公司,未经深圳市伟文无线通讯技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010323145.0/1.html,转载请声明来源钻瓜专利网。