[发明专利]基于声控系统与VR的医疗语音识别构建方法及系统有效
申请号: | 201810433125.1 | 申请日: | 2018-05-08 |
公开(公告)号: | CN108648749B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 吕天予 | 申请(专利权)人: | 上海嘉奥信息科技发展有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/26;G10L15/30;G06F3/01;G06F40/279 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 庄文莉 |
地址: | 201304 上海市浦东*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 声控 系统 vr 医疗 语音 识别 构建 方法 | ||
1.一种基于声控系统与VR的医疗语音识别构建方法,其特征在于,包括:
语音词汇信息库文件列表建立步骤:通过声控系统对应的语音识别基础需求,建立对应的语音词汇信息库文件列表;
调用方法建立步骤:建立调用所述语音词汇信息库文件列表的方法;
按照当前项目的语言语种需求来设计在当前VR虚拟医疗项目中需要使用的语言口令单词列表,并且在声控系统中,以此口令列表来创建一个string类型的数组变量,用来储存此语言口令列表的所有单词数据;
关联系统建立步骤:建立声控系统与语音词汇信息库文件列表的关联系统,将输入的语音信息与语音词汇信息库文件列表中的数据作匹配;
首先,在当前项目的start状态,首先将语音识别系统的每帧检测周围声音的通知,绑定在一个自定义事件中,此事件用来检测当前接受到的任何声音,并且持续的将这些声音输出成与词典中匹配的string字符串;
其次,遍历之前创建的string类型的数组变量,将string类型的数组变量中的单词数据通过一个自定义函数,此自定义函数使用当前遍历到的单词来生成一个记录此单词的语音识别信息的识别短语结构体;
再次,当口令数组遍历完成后,将所有生成的口令识别短语结构体,生成一个口令短语结构体数组,用来在程序start状态中绑定的每帧检测的tick事件中,判断当前识别到的任何声音,是否有与当前短语结构体一致的信息,如果一致,则判断当前用户已经输入了某个口令短语单词成功;
最后,通过不同口音的语种人员来分别测试,以确保无任何的单词单字会导致引擎识别错误,用以保证语音识别的较高准确度;
操作状态切换步骤:通过声控系统将VR中的操作状态切换为声控系统控制、获取对应医疗系统的操作状态。
2.根据权利要求1所述的基于声控系统与VR的医疗语音识别构建方法,其特征在于,所述声控系统为UnrealEngine4引擎声控系统。
3.根据权利要求1所述的基于声控系统与VR的医疗语音识别构建方法,其特征在于,所述调用方法建立步骤还包括:在建立调用所述语音词汇信息库文件列表的方法之后进行测试。
4.根据权利要求1所述的基于声控系统与VR的医疗语音识别构建方法,其特征在于,所述关联系统建立步骤中输入的语音信息通过外部语音设备输入。
5.根据权利要求1所述的基于声控系统与VR的医疗语音识别构建方法,其特征在于,还包括识别灵敏度调整步骤:根据操作情况对语音识别的灵敏度进行调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海嘉奥信息科技发展有限公司,未经上海嘉奥信息科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810433125.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:医院噪声环境下的声学事件检测方法
- 下一篇:混合模型语音识别