[发明专利]基于文字记录的录像存档装置及方法在审
申请号: | 201810896152.2 | 申请日: | 2018-08-08 |
公开(公告)号: | CN108712624A | 公开(公告)日: | 2018-10-26 |
发明(设计)人: | 黄永席;胡淇能 | 申请(专利权)人: | 上海启诺信息科技有限公司 |
主分类号: | H04N5/76 | 分类号: | H04N5/76;H04N7/15;H04N7/18;G10L15/26;G10L17/22;G10L21/0208 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 徐丽 |
地址: | 200120 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字记录 发声位置 音频信息 联动控制装置 存档装置 画面控制 摄像设备 身份信息 视频信息 存档 话筒 音像 指令 设备技术领域 压缩视频信息 压缩音频信息 语音处理模块 录像 音视频会议 存储成本 存储模块 画面细节 拍摄画面 设备采集 压缩处理 音像控制 重要场合 庭审 预设 采集 关联 记录 | ||
1.一种基于文字记录的录像存档装置,其特征在于,包括:音像联动控制装置、与所述音像联动控制装置相连的第一摄像设备和话筒设备,所述音像联动控制装置包括语音处理模块和存储模块;
所述话筒设备,用于采集发言人的音频信息;
所述语音处理模块,用于根据所述音频信息生成文字记录信息和确定发言人的发声位置,根据预先存储的数据进行声纹识别确定发言人的身份信息,并根据所述发声位置生成画面控制指令;
所述第一摄像设备,用于根据所述画面控制指令将拍摄画面切换至与所述发声位置对应的预设位画面,并采集所述预设位画面的视频信息;
所述存储模块,用于将所述音频信息和所述视频信息进行压缩处理,并将所述文字记录信息、所述身份信息与压缩音频信息、压缩视频信息进行关联存档。
2.根据权利要求1所述的装置,其特征在于,还包括与所述音像联动控制装置相连的第二摄像设备;
所述第二摄像设备,用于对全景画面进行视频记录,生成全景视频信息,并将所述全景视频信息发送至所述存储模块,以使所述存储模块将所述全景视频信息进行压缩后存档。
3.根据权利要求1所述的装置,其特征在于,所述语音处理模块包括语音转换模块和声纹识别模块;
所述语音转换模块,用于将所述音频信息进行实时语音转换,生成文字记录信息,并根据所述音频信息检测音频波动,确定发言人的所述发声位置;
所述声纹识别模块,用于根据预先存储的数据对所述音频信息进行声纹识别,确定发言人的所述身份信息,并将所述身份信息发送至所述存储模块,以使所述存储模块根据所述身份信息将所述文字记录信息进行标记后存档。
4.根据权利要求1所述的装置,其特征在于,所述话筒设备包括主话筒和与所述主话筒反向安装的辅话筒;
所述主话筒,用于采集发言人的原始音频信息;
所述辅话筒,用于采集发言人的背景音频信息。
5.根据权利要求4所述的装置,其特征在于,所述音像联动控制装置还包括与所述语音处理模块相连的过滤模块;
所述过滤模块,用于根据声音频率将所述原始音频信息进行对比并过滤,以及,根据所述背景音频信息将所述原始音频信息进行对比并过滤。
6.一种基于文字记录的录像存档方法,其特征在于,包括:
采集步骤:采集发言人的音频信息;
处理步骤:根据所述音频信息生成文字记录信息和确定发言人的发声位置,根据预先存储的数据进行声纹识别确定发言人的身份信息,并根据所述发声位置生成画面控制指令;
切换步骤:根据所述画面控制指令将拍摄画面切换至与所述发声位置对应的预设位画面,并采集所述预设位画面的视频信息;
存档步骤:将所述音频信息和所述视频信息进行压缩处理,并将所述文字记录信息、所述身份信息与压缩音频信息、压缩视频信息进行关联存档。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
对全景画面进行视频记录,生成全景视频信息,并将所述全景视频信息进行压缩后存档。
8.根据权利要求6所述的方法,其特征在于,所述处理步骤包括:
将所述音频信息进行实时语音转换,生成文字记录信息,并根据所述音频信息检测音频波动,确定发言人的所述发声位置;
根据预先存储的数据对所述音频信息进行声纹识别,确定发言人的所述身份信息,并将所述身份信息发送至所述存储模块,以使所述存储模块根据所述身份信息将所述文字记录信息进行标记后存档。
9.根据权利要求6所述的方法,其特征在于,所述方法还包括:
采集发言人的原始音频信息和背景音频信息;
根据声音频率将所述原始音频信息进行对比并过滤,以及,根据所述背景音频信息将所述原始音频信息进行对比并过滤。
10.根据权利要求6所述的方法,其特征在于,所述方法还包括:
采用文字检索的方式在所述文字记录信息中查找匹配的会议文字记录,并调阅对应时间轴上的音频信息和/或视频信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海启诺信息科技有限公司,未经上海启诺信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810896152.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多角度可调节式电视机
- 下一篇:多通道实时高清图像传输系统及传输方法