[发明专利]影像撷取装置的近端控制方法及应用该方法的影像撷取装置无效
申请号: | 200710305593.2 | 申请日: | 2007-12-27 |
公开(公告)号: | CN101472066A | 公开(公告)日: | 2009-07-01 |
发明(设计)人: | 蔡昭宗 | 申请(专利权)人: | 华晶科技股份有限公司 |
主分类号: | H04N5/232 | 分类号: | H04N5/232;G10L15/08 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 周长兴 |
地址: | 台湾省*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 影像 撷取 装置 控制 方法 应用 | ||
1、一种影像撷取装置的近端控制方法,包括以下步骤:
(a)撷取一声音信息及一影像信息;
(b)对该声音信息进行语音辨识处理,并对该影像信息进行影像辨识处理;
(c)判断该声音信息是否可清楚辨识,以决定是否进一步结合该影像信息辅助进行辨识;以及
(d)将该声音信息转换为控制指令予以执行。
2、如权利要求1所述的方法,其中,步骤(b)包括以下步骤:
过滤掉该声音信息中人声频段外的声音;以及
分析该声音信息是否包括一额外人声,以决定该声音信息是否可储存为一声音样本。
3、如权利要求2所述的方法,其中,该声音信息由频率分析或比对一预录声音样本以判断是否包括该额外人声。
4、如权利要求2所述的方法,其中,决定该声音信息是否可储存为一声音样本的步骤后,还包括以下步骤:
消除该声音信息中的背景噪声。
5、如权利要求1所述的方法,其中,步骤(b)是将该声音信息与一语音数据库进行比对。
6、如权利要求1所述的方法,其中,步骤(b)包括以下步骤:
分析该影像信息是否包括一人像,以决定是否对该人像的动作特征进行影像辨识处理。
7、如权利要求6所述的方法,其中,该动作特征包括人脸的嘴形变化、手势或肢体动作。
8、如权利要求1所述的方法,其中,步骤(c)包括以下步骤:
当该声音信息无法清楚辨识时,自一语音数据库中挑选相近于该声音信息的至少一候选语音信息,并仿真可对应各该候选语音信息的影像动作信息。
9、如权利要求8所述的方法,其中,挑选该候选语音信息并仿真可对应各该候选语音信息的影像动作信息的步骤后,还包括以下步骤:
比对该影像信息与各该影像动作信息是否达到一定相似度;以及
当该影像信息与该影像动作信息未达到一定相似度时,发出一警告讯息或返回步骤(a)重新进行辨识。
10、一种影像撷取装置,包括:
一撷取模块,用以撷取一声音信息及一影像信息;
一辨识模块,用以对该声音信息进行语音辨识处理,并对该影像信息进行影像辨识处理;
一判断模块,用以判断该声音信息是否可清楚辨识,以决定是否进一步结合该影像信息辅助进行辨识;以及
一转换模块,用以将该声音信息转换为控制指令予以执行。
11、如权利要求10所述的影像撷取装置,其中,还包括一低通滤波器,以过滤该声音信息中人声频段外的声音。
12、如权利要求10所述的影像撷取装置,其中,包括一指示单元,可发出一警告讯息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华晶科技股份有限公司,未经华晶科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710305593.2/1.html,转载请声明来源钻瓜专利网。