[发明专利]一种智能音响及其播放控制方法有效
申请号: | 201810916504.6 | 申请日: | 2018-08-13 |
公开(公告)号: | CN109327760B | 公开(公告)日: | 2019-12-31 |
发明(设计)人: | 贾瑞花;郭南;王达;叶笑春;范东睿 | 申请(专利权)人: | 北京中科睿芯科技有限公司 |
主分类号: | H04R1/20 | 分类号: | H04R1/20;H04N21/44;H04N21/845;H04N21/4363;G06F3/01 |
代理公司: | 11139 北京科龙寰宇知识产权代理有限责任公司 | 代理人: | 孙皓晨;侯奇慧 |
地址: | 100095 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频文件 智能音响 视频帧 串流 播放控制 二级索引 视频数据 视频文件 数据模型 一级索引 指令控制 总视频 扬声器 中央控制模块 播放 播放模块 存储模块 建立关联 模型构建 人体姿态 索引构建 索引确定 播放点 比对 构建 显示屏 存储 | ||
1.一种智能音响,用于依据人体姿态控制智能音响中多个音频文件的播放动作,其特征在于,包括:
存储模块,用于存储多个音频文件、至少一个视频文件、总视频数据模型、单视频数据模型和指令控制模型,其中,总视频数据模型是提取每一视频文件的前N秒动作信息而建立,单视频数据模型是分别提取每一视频文件中每隔m秒的动作信息而建立,指令控制模型包括开始指令、暂停指令、继续播放指令、从头开始播放指令和下一首指令,指令控制模型中的每一指令对应一人体姿态并且每一指令用于控制音频文件执行相应播放动作;
索引构建模块,用于根据该总视频数据模型构建一级索引,以及根据至少一个单视频数据模型构建一级索引下的二级索引;
中央控制模块,用于将至少一个视频文件分别与其中一个音频文件建立关联关系,以及获取一视频帧串流,依次提取视频帧串流中的视频帧并与指令控制模型进行比对,以控制音频文件的播放;
索引确定模块,当音频文件的播放起点为前N秒之内时,依次提取视频帧串流中的视频帧并与总视频数据模型进行对比,以确定一级索引,之后将视频帧与该一级索引下的单视频数据模型进行比对,以确定二级索引,当音频文件的播放起点不在前N秒之内时,依次提取视频帧串流中的视频帧并与N个单视频数据模型依次比对,以确定二级索引;
播放模块,包括一显示屏和一扬声器,用于根据二级索引确定视频帧串流对应的音频文件及其播放点,以控制音频文件通过扬声器播放以及控制视频帧串流通过显示屏播放。
2.根据权利要求1所述的智能音响,其特征在于,播放模块进一步包括一音频解码模块和一视频解码模块,音频解码模块与扬声器连接,视频解码模块与显示屏连接。
3.根据权利要求2所述的智能音响,其特征在于,进一步包括一无线模块,无线模块通过无线方式获取视频帧串流并将其发送至视频解码模块。
4.根据权利要求3所述的智能音响,其特征在于,所述无线模块为蓝牙模块或wifi模块。
5.一种应用于权利要求1-4任一项所述的智能音响中的智能音响的播放控制方法,该方法用于依据人体姿态控制智能音响中多个音频文件的播放动作,其特征在于,包括以下步骤:
S1:将至少一个视频文件分别与其中一个音频文件建立关联关系;
S2:提取每一视频文件的前N秒动作信息并据此建立一总视频数据模型,根据该总视频数据模型构建一级索引;
S3:分别提取每一视频文件中每隔m秒的动作信息以建立一单视频数据模型,根据至少一个单视频数据模型构建一级索引下的二级索引;
S4:构建一指令控制模型,指令控制模型包括开始指令、暂停指令、继续播放指令、从头开始播放指令和下一首指令,指令控制模型中的每一指令对应一人体姿态并且每一指令用于控制音频文件执行相应播放动作;
S5:获取一视频帧串流;
S6:依次提取视频帧串流中的视频帧并与指令控制模型进行比对,以控制音频文件的播放;
S7:当音频文件的播放起点为前N秒之内时,依次提取视频帧串流中的视频帧并与总视频数据模型进行对比,以确定一级索引,之后将视频帧与该一级索引下的单视频数据模型进行比对,以确定二级索引,
当音频文件的播放起点不在前N秒之内时,依次提取视频帧串流中的视频帧并与N个单视频数据模型依次比对,以确定二级索引;
S8:根据二级索引确定视频帧串流对应的音频文件及其播放点,以控制音频文件进行播放。
6.根据权利要求5所述的智能音响的播放控制方法,其特征在于,步骤S5中,视频帧串流是从摄像头获取的用户实时影像中撷取。
7.根据权利要求5所述的智能音响的播放控制方法,其特征在于,步骤S5中,视频帧串流是从网络端获取的视频影像中撷取。
8.根据权利要求5所述的智能音响的播放控制方法,其特征在于,视频帧串流是从连续的视频帧串流中间隔提取。
9.根据权利要求5所述的智能音响的播放控制方法,其特征在于,于步骤S2和S3中,提取视频文件中的动作信息并对其打上相应的标签,进而通过对其中的关键帧进行聚类的方式构建一级索引或二级索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科睿芯科技有限公司,未经北京中科睿芯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810916504.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耳机
- 下一篇:一种合成波低频增压器及其音响、低频增压方法