[发明专利]一种肢体康复设备语音交互控制方法在审
申请号: | 202011185814.9 | 申请日: | 2020-10-29 |
公开(公告)号: | CN112365890A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 张延恒;康少琦;张莹 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/34;G10L21/02;G10L21/0216 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 肢体 康复 设备 语音 交互 控制 方法 | ||
1.一种肢体康复设备语音交互控制方法,其特征在于,包括特殊设计的语音控制命令库和语音交互控制算法;所述的特殊设计的语音控制命令库包含一系列语音控制命令字段;所述的语音控制命令字段包括语义命令字段和语音验证码字段;所述的语义命令字段包含运动动作和运动参数两部分,基于肢体康复设备的运动,结合医学用语、生活口语进行设计,基于使用场景进行测试;所述肢体康复设备的运动包括腿部、臂部、手部等康复运动;所述生活口语包括语序倒装、发音非标准化现象;所述使用场景,包括家庭室内场景、医院康复中心场景等,主要考虑该场景下的噪声特性,包括静音环境、低噪声环境、高噪声环境等,测试方法为将音乐、朗诵、高斯白噪声等不同类型的噪声,以20%、40%、60%、80%的噪声能量比混入待测试语义命令中,测试该命令的语音识别准确度,结果评价以识别结果中的字词错误率为主;所述的语音验证码字段基于运动部位、运动类别、运动参数信息进行设计,与语义命令字段一一对应;语音验证码的第一位根据运动部位的不同进行编号,语音验证码的第二位根据具体动作的不同进行编号,语音验证码的后续位数字表示运动参数,语音验证码一般是但不限于四位数字;所述的语音交互控制算法包括语音分离算法、语音识别算法、语义分析算法;所述语音分离方法为利用麦克风获取患者带噪语音命令、利用语音分离算法提取出较纯净的语音命令;所述语音识别方法为利用云端语音识别算法识别语音命令、识别结果反馈回本地进行后续处理;所述语义分析方法为利用信息抽取算法抽取语音命令中包含的患者信息、运动信息、以及语音验证码信息;所述的信息抽取算法为利用BERT预训练模型对新闻文本训练集与医疗文本数据集进行预训练,在得到预训练结果后,对包含标注信息的口语化语音控制命令文本数据集进行迁移学习和微调,使计算机可以准确识别出患者语音中包含的语音控制命令;所述的口语化语音控制命令文本数据集是指将上述语音控制命令用口语化的方式表达后产生的文本数据集。所述的一种肢体康复设备语音交互控制方法包括以下步骤:
S1、通过麦克风获取患者口述的带噪语音控制命令字段;
S2、带噪患者语音经过语音分离算法处理减弱噪声,获得较为纯净的患者语音;
S3、较纯净语音上传至云端利用语音识别算法进行识别,识别结果转化为对应的中文识别结果字符串返回本地;
S4、识别结果经过信息抽取算法处理,抽取出语音命令所包含的患者信息、运动信息、以及语音验证码信息;
S5、抽取到的信息经过命令校验进行确认,确定无误后触发对应动作和运动参数的响应。
2.如权利要求1中所述的一种肢体康复设备语音控制交互方法,其特征在于步骤S1和S2,利用阵列式麦克风采集患者的语音命令及环境噪声;所述阵列式麦克风,可以通过同一声音到达不同阵列位置麦克风的时间不同判断声源位置信息;所述语音分离算法可以使用但不限于GCC-NMF算法,GCC-NMF算法可以利用声源位置信息将患者语音和背景噪声分离,从而提取出较为纯净的患者语音,提升语音识别的鲁棒性。
3.如权利要求1中所述的一种肢体康复设备语音控制交互方法,其特征在于步骤S3,所述语音识别部分会将分离提纯后的患者命令语音上传至云端进行识别,并返回识别结果;所述云端是指具有大数据存储容量和强计算能力的上位机,内含语音识别所需要的庞大识别算法模型和数据计算速度;所述识别结果会从云端以中文字符串的形式返回本地。
4.如权利要求1中所述的一种肢体康复设备语音控制交互方法,其特征在于步骤S4,所述语义分析部分会将语音识别结果中文字符串进行结构化信息抽取,包括命名实体识别、运动信息识别、验证码信息识别;所述结构化信息抽取可以识别出中文字符串中指定类别的内容,并以{类别:内容}的格式返回;所述命名实体识别可以识别出语音中的患者姓名或患者编号;所述运动信息识别可以识别出语音中的康复动作指令和对应的运动参数指令;所述语音验证码信息识别可以识别出语音验证码内容。
5.如权利要求1中所述的一种肢体康复设备语音控制交互方法,其特征在于步骤S5,所述命令校验,通过查询识别结果中的康复动作和语音验证码是否在语音控制命令库中,以及二者是否匹配进行校验。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011185814.9/1.html,转载请声明来源钻瓜专利网。