[发明专利]基于文字记录的录像存档装置及方法在审

专利信息
申请号: 201810896152.2 申请日: 2018-08-08
公开(公告)号: CN108712624A 公开(公告)日: 2018-10-26
发明(设计)人: 黄永席;胡淇能 申请(专利权)人: 上海启诺信息科技有限公司
主分类号: H04N5/76 分类号: H04N5/76;H04N7/15;H04N7/18;G10L15/26;G10L17/22;G10L21/0208
代理公司: 北京超凡志成知识产权代理事务所(普通合伙) 11371 代理人: 徐丽
地址: 200120 上海市浦东新区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文字记录 发声位置 音频信息 联动控制装置 存档装置 画面控制 摄像设备 身份信息 视频信息 存档 话筒 音像 指令 设备技术领域 压缩视频信息 压缩音频信息 语音处理模块 录像 音视频会议 存储成本 存储模块 画面细节 拍摄画面 设备采集 压缩处理 音像控制 重要场合 庭审 预设 采集 关联 记录
【权利要求书】:

1.一种基于文字记录的录像存档装置,其特征在于,包括:音像联动控制装置、与所述音像联动控制装置相连的第一摄像设备和话筒设备,所述音像联动控制装置包括语音处理模块和存储模块;

所述话筒设备,用于采集发言人的音频信息;

所述语音处理模块,用于根据所述音频信息生成文字记录信息和确定发言人的发声位置,根据预先存储的数据进行声纹识别确定发言人的身份信息,并根据所述发声位置生成画面控制指令;

所述第一摄像设备,用于根据所述画面控制指令将拍摄画面切换至与所述发声位置对应的预设位画面,并采集所述预设位画面的视频信息;

所述存储模块,用于将所述音频信息和所述视频信息进行压缩处理,并将所述文字记录信息、所述身份信息与压缩音频信息、压缩视频信息进行关联存档。

2.根据权利要求1所述的装置,其特征在于,还包括与所述音像联动控制装置相连的第二摄像设备;

所述第二摄像设备,用于对全景画面进行视频记录,生成全景视频信息,并将所述全景视频信息发送至所述存储模块,以使所述存储模块将所述全景视频信息进行压缩后存档。

3.根据权利要求1所述的装置,其特征在于,所述语音处理模块包括语音转换模块和声纹识别模块;

所述语音转换模块,用于将所述音频信息进行实时语音转换,生成文字记录信息,并根据所述音频信息检测音频波动,确定发言人的所述发声位置;

所述声纹识别模块,用于根据预先存储的数据对所述音频信息进行声纹识别,确定发言人的所述身份信息,并将所述身份信息发送至所述存储模块,以使所述存储模块根据所述身份信息将所述文字记录信息进行标记后存档。

4.根据权利要求1所述的装置,其特征在于,所述话筒设备包括主话筒和与所述主话筒反向安装的辅话筒;

所述主话筒,用于采集发言人的原始音频信息;

所述辅话筒,用于采集发言人的背景音频信息。

5.根据权利要求4所述的装置,其特征在于,所述音像联动控制装置还包括与所述语音处理模块相连的过滤模块;

所述过滤模块,用于根据声音频率将所述原始音频信息进行对比并过滤,以及,根据所述背景音频信息将所述原始音频信息进行对比并过滤。

6.一种基于文字记录的录像存档方法,其特征在于,包括:

采集步骤:采集发言人的音频信息;

处理步骤:根据所述音频信息生成文字记录信息和确定发言人的发声位置,根据预先存储的数据进行声纹识别确定发言人的身份信息,并根据所述发声位置生成画面控制指令;

切换步骤:根据所述画面控制指令将拍摄画面切换至与所述发声位置对应的预设位画面,并采集所述预设位画面的视频信息;

存档步骤:将所述音频信息和所述视频信息进行压缩处理,并将所述文字记录信息、所述身份信息与压缩音频信息、压缩视频信息进行关联存档。

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

对全景画面进行视频记录,生成全景视频信息,并将所述全景视频信息进行压缩后存档。

8.根据权利要求6所述的方法,其特征在于,所述处理步骤包括:

将所述音频信息进行实时语音转换,生成文字记录信息,并根据所述音频信息检测音频波动,确定发言人的所述发声位置;

根据预先存储的数据对所述音频信息进行声纹识别,确定发言人的所述身份信息,并将所述身份信息发送至所述存储模块,以使所述存储模块根据所述身份信息将所述文字记录信息进行标记后存档。

9.根据权利要求6所述的方法,其特征在于,所述方法还包括:

采集发言人的原始音频信息和背景音频信息;

根据声音频率将所述原始音频信息进行对比并过滤,以及,根据所述背景音频信息将所述原始音频信息进行对比并过滤。

10.根据权利要求6所述的方法,其特征在于,所述方法还包括:

采用文字检索的方式在所述文字记录信息中查找匹配的会议文字记录,并调阅对应时间轴上的音频信息和/或视频信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海启诺信息科技有限公司,未经上海启诺信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810896152.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top