[发明专利]一种基于语音识别的场景交互控制方法有效

申请号：	201811581756.4	申请日：	2018-12-24
公开（公告）号：	CN109616111B	公开（公告）日：	2023-03-14
发明（设计）人：	钱苏晋;门涛;刘鹏;董杰;周金涛	申请（专利权）人：	北京恒泰实达科技股份有限公司;国网冀北电力有限公司智能配电网中心
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/08
代理公司：	北京市盛峰律师事务所 11337	代理人：	席小东
地址：	100190 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于语音识别场景交互控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于语音识别的场景交互控制方法，其特征在于，包括以下步骤：

步骤1，中央控制系统预建立快照库；所述快照库存储若干条快照名称以及快照场景执行命令的对应关系；通过所述快照场景执行命令，所述中央控制系统对会场设备进行控制；

语音识别控制程序为避免误操作，平时处于未被唤醒的休眠状态；此时，唤醒语监听程序持续为打开状态；主语音监听程序持续关闭状态；

步骤2，所述唤醒语监听程序实时监听，判断是否监听到唤醒词；如果没有监听到唤醒词，则持续进行监听；如果监听到唤醒词，则执行步骤3；

步骤3，中央控制系统关闭所述唤醒语监听程序，开启所述主语音监听程序，进而唤醒所述中央控制系统的语音识别控制程序，此时所述中央控制系统的语音识别控制程序转变为激活状态；

步骤4，所述中央控制系统的语音识别控制程序启动语音录制模块，通过所述语音录制模块录制来自于用户的语音命令，并存储录制到的所述语音命令；同时，在所述语音录制模块录制所述语音命令的过程中，通过显示模块显示语音音量波形；

步骤5，所述语音录制模块将录制到的所述语音命令传输给语音识别模块；

步骤6，所述语音识别模块对所述语音命令进行初步语音有效性识别，如果识别成功，则执行步骤7；如果未识别成功，则向用户反馈识别失败的提示信息；

步骤7，所述语音识别模块对所述语音命令进行意图识别，识别出以下四种类型中的一种：快照类型、选项类型、确认/取消类型和其他类型；

如果所述语音命令为快照类型，则通过快照类型子模块执行步骤8；如果所述语音命令为选项类型，则通过选项类型子模块执行步骤9；如果所述语音命令为确认/取消类型，则通过确认/取消类型子模块执行步骤10；如果所述语音命令为其他类型，则通过其他类型子模块执行步骤11；

步骤8：通过快照类型子模块执行与快照类型对应的语音命令，包括以下步骤：

步骤8.1，如果所述语音命令为快照类型，得到所述语音命令的识别度分数，并判断所述识别度分数是否超过阈值，如果没有超过，表明所述语音命令不够明确，则执行步骤8.2；如果超过，表明所述语音命令明确，则执行步骤8.3；

步骤8.2，对所述语音命令进行进一步的识别结果唯一性判断，即：判断识别结果是否为多音情况，如果不是，则表明语音命令对应快照库里唯一读音的快照名称，并通过显示模块输出是否执行快照的进一步确认的提示信息，同时，在确认/取消上下文配置表中记录本次确认/取消的对象信息，然后由确认/取消类型子模块执行后续步骤；如果是，则表明语音命令对应快照库里多音的快照名称，并将多音的各个快照名称形成多音快照结果集合，并通过显示模块显示所述多音快照结果集合，同时，在选项上下文配置表中记录本次选项信息，并由所述选项类型子模块执行后续步骤；

步骤8.3，对所述语音命令进行进一步的识别结果唯一性判断，即：判断识别结果是否为多音情况，如果不是，则表明语音命令对应快照库里唯一读音的快照名称，并直接执行与所述快照名称对应的快照场景命令；如果是，则表明语音命令对应快照库里多音的快照名称，并将多音的各个快照名称形成多音快照结果集合，并通过显示模块显示所述多音快照结果集合，同时，在选项配置表中记录本次选项信息，并由所述选项类型子模块执行后续步骤；

每当所述选项上下文配置表存储选项信息后，当任意下一条来自于用户的语音命令被执行后，即清空所述选项上下文配置表；

每当所述确认/取消上下文配置表存储确认/取消的对象信息后，当任意下一条来自于用户的语音命令被执行后，即清空所述确认/取消上下文配置表；

具体的，快照类型子模块将快照类型的语音命令进行“识别分数超过阈值”，该阈值依据是“语音识别”结果的识别度高低判断，如超过阈值，系统认为该指令明确，进行后续的“识别结果唯一”性判断，如果识别结果唯一，不需要向用户确认，可直接进行快照执行指令；如果识别结果不唯一，表明为多音快照名称，则向用户推送对应的快照名称列表，待用户从列表中选择对应的快照名称后，不再进一步向用户确认，直接进行快照执行指令；如识别度低于阈值，系统认为该指令不够明确，先进行“识别结果唯一”判断，如是识别结果唯一，则仍然需要在显示模块输出提示信息，请用户进一步确认是否执行该快照，系统播放语音提示“是否执行某某快照”；如果是多音情况，则交由多音处理模块处理；

步骤9，通过选项类型子模块执行与选项类型对应的语音命令，包括以下步骤：

如果所述语音命令为选项类型，首先查找所述选项上下文配置表，判断所述选项上下文配置表是否为空，如果不为空，表明存在与所述语音命令对应的上文信息，则根据所述选项上下文配置表中存储的所述选项信息以及所述语音命令，直接执行对应的快照场景命令；如果所述选项上下文配置表为空，则表明不存在上文信息，则通过显示模块输出语音识别失败的提示信息；

具体的，选项类型子模块需要具备上下文记忆能力，当遇到多音快照名称时，系统会进行“多音处理”，提供用户多音快照名称集合选择；系统识别到语音命令为选项类型后，会先基于选项上下文配置表判断是否有上文信息，如果有，则与上一回合对话的选项进行匹配，并将明确的选项进行快照执行，系统语音会给予播放执行某某快照成功的信息，显示设备输出执行某某快照成功的信息；如果没有上文信息，系统设计从拟人角度考虑，当一个没有上文支持的话题，认为该情况是一个非法操作，系统则播放语音提示道歉语句，同时显示设备输出提示类语句；

步骤10，通过确认/取消类型子模块执行与确认/取消类型对应的语音命令，包括以下步骤：

如果所述语音命令为确认/取消类型，首先查找所述确认/取消上下文配置表，判断所述确认/取消上下文配置表是否为空，如果不为空，表明存在与所述语音命令对应的上文信息，则根据所述确认/取消上下文配置表中存储的确认/取消的对象信息以及所述语音命令，直接执行对应的快照场景命令；如果所述确认/取消上下文配置表为空，则表明不存在上文信息，则通过显示模块输出语音识别失败的提示信息；

具体的，确认/取消类型子模块同样是上下文处理情况，用于处理低于语音识别度设定阈值的结果二次确认，系统识别到确认/取消类型后，首先基于确认/取消上下文配置表判断是否有上文信息，如果有上文信息，则进行快照执行，系统语音会给予播放执行某某快照成功的信息，显示设备输出执行某某快照成功的信息；如果没有上文信息，系统设计从拟人角度考虑，当一个没有上文支持的话题，认为该情况是一个非法操作，系统则播放语音提示道歉语句，同时显示设备输出提示类语句；

步骤11，通过其他类型子模块执行与其他类型对应的语音命令，包括以下步骤：通过显示模块输出语音识别失败的提示信息；

其中，配置唤醒按钮，当所述唤醒按钮被点击时，手动将所述中央控制系统的语音识别控制程序从休眠状态唤醒为激活状态；

其中，通过显示模块输出语音识别失败的提示信息具体为：播放语音提示道歉语句，同时输出更换语音命令的提示类语句；

其中，步骤1中，所述中央控制系统所建立的快照库实时动态更新；

其中，所述中央控制系统对会场设备的控制方式包括：触摸点击屏幕、遥控笔按键触发和语音识别控制。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京恒泰实达科技股份有限公司;国网冀北电力有限公司智能配电网中心，未经北京恒泰实达科技股份有限公司;国网冀北电力有限公司智能配电网中心许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811581756.4/1.html，转载请声明来源钻瓜专利网。

上一篇：一种交互方法、系统、电子设备及服务器
下一篇：一种基于二维码的动物认知语音交互系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于语音识别的场景交互控制方法有效

专利文献下载