[发明专利]一种基于语音识别的场景交互控制方法有效

申请号：	201811581756.4	申请日：	2018-12-24
公开（公告）号：	CN109616111B	公开（公告）日：	2023-03-14
发明（设计）人：	钱苏晋;门涛;刘鹏;董杰;周金涛	申请（专利权）人：	北京恒泰实达科技股份有限公司;国网冀北电力有限公司智能配电网中心
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/08
代理公司：	北京市盛峰律师事务所 11337	代理人：	席小东
地址：	100190 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种基于语音识别的场景交互控制方法，包括：中央控制系统预建立快照库；中央控制系统的语音识别控制程序转变为激活状态后，中央控制系统的语音识别控制程序启动语音录制模块，录制来自于用户的语音命令；语音识别模块对所述语音命令进行意图识别，识别出以下四种类型中的一种：快照类型、选项类型、确认/取消类型和其他类型，并分别执行。优点为：本发明提供的一种基于语音识别的场景交互控制方法，将中央控制系统和语音识别技术结合，实现了用语言代替传统输入设备控制中央控制系统的功能，具有用户体验好的优点。
搜索关键词：	一种基于语音识别场景交互控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于语音识别的场景交互控制方法，其特征在于，包括以下步骤：步骤1，中央控制系统预建立快照库；所述快照库存储若干条快照名称以及快照场景执行命令的对应关系；通过所述快照场景执行命令，所述中央控制系统对会场设备进行控制；语音识别控制程序为避免误操作，平时处于未被唤醒的休眠状态；此时，唤醒语监听程序持续为打开状态；主语音监听程序持续关闭状态；步骤2，所述唤醒语监听程序实时监听，判断是否监听到唤醒词；如果没有监听到唤醒词，则持续进行监听；如果监听到唤醒词，则执行步骤3；步骤3，中央控制系统关闭所述唤醒语监听程序，开启所述主语音监听程序，进而唤醒所述中央控制系统的语音识别控制程序，此时所述中央控制系统的语音识别控制程序转变为激活状态；步骤4，所述中央控制系统的语音识别控制程序启动语音录制模块，通过所述语音录制模块录制来自于用户的语音命令，并存储录制到的所述语音命令；同时，在所述语音录制模块录制所述语音命令的过程中，通过显示模块显示语音音量波形；步骤5，所述语音录制模块将录制到的所述语音命令传输给语音识别模块；步骤6，所述语音识别模块对所述语音命令进行初步语音有效性识别，如果识别成功，则执行步骤7；如果未识别成功，则向用户反馈识别失败的提示信息；步骤7，所述语音识别模块对所述语音命令进行意图识别，识别出以下四种类型中的一种：快照类型、选项类型、确认/取消类型和其他类型；如果所述语音命令为快照类型，则通过快照类型子模块执行步骤8；如果所述语音命令为选项类型，则通过选项类型子模块执行步骤9；如果所述语音命令为确认/取消类型，则通过确认/取消类型子模块执行步骤10；如果所述语音命令为其他类型，则通过其他类型子模块执行步骤11；步骤8：通过快照类型子模块执行与快照类型对应的语音命令，包括以下步骤：步骤8.1，如果所述语音命令为快照类型，得到所述语音命令的识别度分数，并判断所述识别度分数是否超过阈值，如果没有超过，表明所述语音命令不够明确，则执行步骤8.2；如果超过，表明所述语音命令明确，则执行步骤8.3；步骤8.2，对所述语音命令进行进一步的识别结果唯一性判断，即：判断识别结果是否为多音情况，如果不是，则表明语音命令对应快照库里唯一读音的快照名称，并通过显示模块输出是否执行快照的进一步确认的提示信息，同时，在确认/取消上下文配置表中记录本次确认/取消的对象信息，然后由确认/取消类型子模块执行后续步骤；如果是，则表明语音命令对应快照库里多音的快照名称，并将多音的各个快照名称形成多音快照结果集合，并通过显示模块显示所述多音快照结果集合，同时，在选项上下文配置表中记录本次选项信息，并由所述选项类型子模块执行后续步骤；步骤8.3，对所述语音命令进行进一步的识别结果唯一性判断，即：判断识别结果是否为多音情况，如果不是，则表明语音命令对应快照库里唯一读音的快照名称，并直接执行与所述快照名称对应的快照场景命令；如果是，则表明语音命令对应快照库里多音的快照名称，并将多音的各个快照名称形成多音快照结果集合，并通过显示模块显示所述多音快照结果集合，同时，在选项配置表中记录本次选项信息，并由所述选项类型子模块执行后续步骤；每当所述选项上下文配置表存储选项信息后，当任意下一条来自于用户的语音命令被执行后，即清空所述选项上下文配置表；每当所述确认/取消上下文配置表存储确认/取消的对象信息后，当任意下一条来自于用户的语音命令被执行后，即清空所述确认/取消上下文配置表；步骤9，通过选项类型子模块执行与选项类型对应的语音命令，包括以下步骤：如果所述语音命令为选项类型，首先查找所述选项上下文配置表，判断所述选项上下文配置表是否为空，如果不为空，表明存在与所述语音命令对应的上文信息，则根据所述选项上下文配置表中存储的所述选项信息以及所述语音命令，直接执行对应的快照场景命令；如果所述选项上下文配置表为空，则表明不存在上文信息，则通过显示模块输出语音识别失败的提示信息；步骤10，通过确认/取消类型子模块执行与确认/取消类型对应的语音命令，包括以下步骤：如果所述语音命令为确认/取消类型，首先查找所述确认/取消上下文配置表，判断所述确认/取消上下文配置表是否为空，如果不为空，表明存在与所述语音命令对应的上文信息，则根据所述确认/取消上下文配置表中存储的确认/取消的对象信息以及所述语音命令，直接执行对应的快照场景命令；如果所述确认/取消上下文配置表为空，则表明不存在上文信息，则通过显示模块输出语音识别失败的提示信息；步骤11，通过其他类型子模块执行与其他类型对应的语音命令，包括以下步骤：通过显示模块输出语音识别失败的提示信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京恒泰实达科技股份有限公司;国网冀北电力有限公司智能配电网中心，未经北京恒泰实达科技股份有限公司;国网冀北电力有限公司智能配电网中心许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811581756.4/，转载请声明来源钻瓜专利网。

上一篇：一种交互方法、系统、电子设备及服务器
下一篇：一种基于二维码的动物认知语音交互系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于语音识别的场景交互控制方法有效

专利文献下载