[发明专利]一种基于场景识别的自动调整声音和图像模式的方法及系统在审
申请号: | 201910997614.4 | 申请日: | 2019-10-21 |
公开(公告)号: | CN110493639A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 梁彪;余海超 | 申请(专利权)人: | 南京创维信息技术研究院有限公司 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/439;H04N21/485 |
代理公司: | 32319 江苏舜点律师事务所 | 代理人: | 孙丹<国际申请>=<国际公布>=<进入国 |
地址: | 210012 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像模式 声音模式 场景识别 匹配结果 视频画面 截取 技术方案要点 图像调整模块 场景 场景图片 电视节目 分类标签 服务模块 截取模块 模型匹配 声音调整 用户观看 指令调用 加载 视听 指令 播放 | ||
本发明公开了一种基于场景识别的自动调整声音和图像模式的方法及系统,解决了用户观看电视节目时不能自动调整声音模式和图像模式的技术问题,其技术方案要点是场景图片截取模块截取当前播放的视频画面,场景识别模块对截取的视频画面进行识别,得到识别结果后发出识别指令,场景服务模块根据识别指令调用场景本地模型,加载分类标签进行模型匹配,得到匹配结果,声音调整模块和图像调整模块依据匹配结果调整声音模式和图像模式,最终实现声音模式和图像模式的自动调整,无需手动操作就能达到最佳的视听体验效果。
技术领域
本公开涉及智能电视技术领域,尤其涉及一种基于场景识别的自动调整声音和图像模式的方法及系统。
背景技术
当前电视领域的声音和图像调整有两种方法,一种方法是电视出厂时会在系统中设置好声音和图像对应的参数;另一种是为用户提供人机交互界面,给出几种声音图像模式来供用户手动调整。这两种方法的缺点就是不管在任何场景下声音和图像模式都是不变的,直到用户再一次手动调整。比如用户设置了图像模式为新闻模式,但是在看电视剧或者电影时,新闻模式就不合适了,针对图像的新闻模式只有当用户在观看新闻时才能得到最近的观看效果,若要调整为其他的观看模式,就要手动进行调整,不能自动进行模式的切换。
发明内容
本公开的目的是提供一种基于场景识别的自动调整声音和图像模式的方法及系统,达到自动调整声音模式和图像模式的目的。
本公开的上述技术目的是通过以下技术方案得以实现的:
一种基于场景识别的自动调整声音和图像模式的方法,包括:
截取当前播放的视频画面;
采用分类模型识别所述视频画面,获取识别结果并发出识别指令;
根据所述识别指令调用场景本地模型,加载分类标签进行模型匹配,得到匹配结果;
根据所述匹配结果自动调整声音模式和图像模式。
作为具体实施例地,所述分类模型和所述分类标签由深度学习网络训练而成。
进一步地,所述分类模型通过具有深度学习能力的自学习平台的服务来完成识别。
进一步地,所述自学习平台包括Tensorflow Lite平台。
进一步地,所述场景本地模型包括音乐模型、篮球模型、足球模型、动画片模型、新闻模型、广播模型、动物世界模型、教育资源模型、广告模型、喜剧片模型、动作片模型、恐怖片模型、枪战片模型和综艺模型。
进一步地,所述声音模式包含的参数有低音、重低音、中音、中高音、高音、环绕声和杜比。
进一步地,所述图像模式包含的参数有亮度、饱和度、清晰度、背光、色度和图像局部的特征。
一种基于场景识别的自动调整声音和图像模式的系统,包括:
场景图片截取模块,截取当前播放的视频画面;
场景识别模块,采用分类模型识别所述视频画面,获取识别结果并发出识别指令;
场景服务模块,根据所述识别指令调用场景本地模型,加载分类标签进行模型匹配,得到匹配结果;
声音调整模块和图像调整模块,根据所述匹配结果调整声音模式和图像模式;
存储模块,存储场景本地模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京创维信息技术研究院有限公司,未经南京创维信息技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910997614.4/2.html,转载请声明来源钻瓜专利网。