[发明专利]语言识别方法、装置及电子设备有效
申请号: | 202011566731.4 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112672021B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 李沛德;王丹 | 申请(专利权)人: | 维沃移动通信有限公司 |
主分类号: | H04N5/225 | 分类号: | H04N5/225;H04N5/232;G10L15/00;G10L15/25 |
代理公司: | 北京远志博慧知识产权代理事务所(普通合伙) 11680 | 代理人: | 李翠雅 |
地址: | 523863 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语言 识别 方法 装置 电子设备 | ||
本申请公开了一种语言识别方法、装置及电子设备,属于通信技术领域,能够解决电子设备进行人脸运动部位的信息识别的效率和成功率较低的问题。该方法包括:通过FPI多光谱组件,获取待拍摄对象的人脸部位对应的目标光线;根据目标光线,通过实感像素传感器获取目标部位的目标图像序列,该目标部位为人脸部位中处于运动状态的部位;根据目标图像序列,输出目标部位对应的语言信息。本申请实施例应用于电子设备进行人脸运动部位的信息识别的过程中。
技术领域
本申请属于通信技术领域,具体涉及一种语言识别方法、装置及电子设备。
背景技术
通常,用户可以电子设备的镜头进行图像采集,以用于人脸识别、唇语识别等功能。具体的,电子设备可以基于镜头的传感器中的大量感光二极管,先清空每个感光二极管中积累的电荷,然后在设定的曝光时间内,对用户人脸的光信号进行转换处理,以形成数字信号矩阵(即图像),再通过传感器的进行卷帘式曝光(rolling shutter),即传感器逐行扫描逐行进行曝光,直至所有像素点都被曝光,以捕捉用户的图像,从而获得正在说话的用户的口型信息,实现唇语识别功能。
然而,上述方式会导致镜头的成像速度变慢,在拍摄运动的对象(例如高速运动物体)时,会出现“倾斜”、“摇摆不定”或“部分曝光””等现象,该现象被定义为果冻效应,从而导致捕捉图像信号的实时性和准确性较差,如此导致电子设备进行人脸运动部位的信息识别的效率和成功率较低。
发明内容
本申请实施例的目的是提供一种语言识别方法、装置及电子设备,能够解决电子设备进行人脸运动部位的信息识别的效率和成功率较低的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种语言识别方法,应用于电子设备,电子设备的摄像头模组包括FPI多光谱组件和实感像素传感器,该语言识别方法包括:通过FPI多光谱组件,获取待拍摄对象的人脸部位对应的目标光线;根据目标光线,通过实感像素传感器获取目标部位的目标图像序列,该目标部位为人脸部位中处于运动状态的部位;根据目标图像序列,输出目标部位对应的语言信息。
第二方面,本申请实施例提供了一种语言识别装置,该语言识别装置的摄像头模组包括FPI多光谱组件和实感像素传感器,该语言识别装置包括:获取模块和输出模块。其中,获取模块,用于通过FPI多光谱组件,获取待拍摄对象的人脸部位对应的目标光线;并根据目标光线,通过实感像素传感器获取目标部位的目标图像序列,该目标部位为人脸部位中处于运动状态的部位。输出模块,用于根据获取模块获取的目标图像序列,输出目标部位对应的语言信息。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维沃移动通信有限公司,未经维沃移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011566731.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:侧栅晶体管太赫兹探测器及其制备方法
- 下一篇:一种量子点显示面板及其制备方法