[发明专利]一种基于场景识别的自动调整声音和图像模式的方法及系统在审
申请号: | 201910997614.4 | 申请日: | 2019-10-21 |
公开(公告)号: | CN110493639A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 梁彪;余海超 | 申请(专利权)人: | 南京创维信息技术研究院有限公司 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/439;H04N21/485 |
代理公司: | 32319 江苏舜点律师事务所 | 代理人: | 孙丹<国际申请>=<国际公布>=<进入国 |
地址: | 210012 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像模式 声音模式 场景识别 匹配结果 视频画面 截取 技术方案要点 图像调整模块 场景 场景图片 电视节目 分类标签 服务模块 截取模块 模型匹配 声音调整 用户观看 指令调用 加载 视听 指令 播放 | ||
1.一种基于场景识别的自动调整声音和图像模式的方法,其特征在于,包括:
截取当前播放的视频画面;
采用分类模型识别所述视频画面,获取识别结果并发出识别指令;
根据所述识别指令调用场景本地模型,加载分类标签进行模型匹配,得到匹配结果;
根据所述匹配结果自动调整声音模式和图像模式。
2.如权利要求1所述的基于场景识别的自动调整切换声音和图像模式的方法,其特征在于,所述分类模型和所述分类标签由深度学习网络训练而成。
3.如权利要求2所述的基于场景识别的自动调整切换声音和图像模式的方法,其特征在于,所述分类模型通过具有深度学习能力的自学习平台的服务来完成识别。
4.如权利要求3所述的基于场景识别的自动调整切换声音和图像模式的方法,其特征在于,所述自学习平台包括Tensorflow Lite平台。
5.如权利要求1-4任一所述的基于场景识别的自动调整切换声音和图像模式的方法,其特征在于,所述场景本地模型包括音乐模型、篮球模型、足球模型、动画片模型、新闻模型、广播模型、动物世界模型、教育资源模型、广告模型、喜剧片模型、动作片模型、恐怖片模型、枪战片模型和综艺模型。
6.如权利要求1-4任一所述的基于场景识别的自动调整声音和图像模式的方法,其特征在于,所述声音模式包含的参数有低音、重低音、中音、中高音、高音、环绕声和杜比。
7.如权利要求1-4任一所述的基于场景识别的自动调整声音和图像模式的方法,其特征在于,所述图像模式包含的参数有亮度、饱和度、清晰度、背光、色度和图像局部的特征。
8.一种基于场景识别的自动调整声音和图像模式的系统,其特征在于,包括:
场景图片截取模块,截取当前播放的视频画面;
场景识别模块,采用分类模型识别所述视频画面,获取识别结果并发出识别指令;
场景服务模块,根据所述识别指令调用场景本地模型,加载分类标签进行模型匹配,得到匹配结果;
声音调整模块和图像调整模块,根据所述匹配结果调整声音模式和图像模式;
存储模块,存储场景本地模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京创维信息技术研究院有限公司,未经南京创维信息技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910997614.4/1.html,转载请声明来源钻瓜专利网。