[发明专利]一种基于视频分析的说话识别方法、系统、设备及介质有效
申请号: | 202110587534.9 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113177531B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 黄欢;尹士朝 | 申请(专利权)人: | 广州广电运通智能科技有限公司;广州广电运通金融电子股份有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V20/40;G10L15/22 |
代理公司: | 杭州创智卓英知识产权代理事务所(普通合伙) 33324 | 代理人: | 张超 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于视频分析的说话识别方法,包括对目标视频数据中每一视频帧进行裁剪处理以及灰度化处理,得到每一视频帧对应的输入图像;对所有输入图像进行人脸检测处理,得到人脸检测框;对所有输入图像对应的人脸检测框进行筛选,将符合预设人脸筛选规则的每一视频帧对应的人脸检测框作为这一帧的最终人脸检测框;根据最终人脸检测框中嘴唇轮廓和脸部关键点计算出每一最终人脸检测框对应的特征结果,将含有若干特征结果输入至预设说话识别模型中进行识别,得到与待识别人物对应的说话识别结果。本发明的一种基于视频分析的说话识别方法,使得到的说话识别结果更加精准,而且可以适应待识别人物说话时的不同形态。 | ||
搜索关键词: | 一种 基于 视频 分析 说话 识别 方法 系统 设备 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州广电运通智能科技有限公司;广州广电运通金融电子股份有限公司,未经广州广电运通智能科技有限公司;广州广电运通金融电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110587534.9/,转载请声明来源钻瓜专利网。