[发明专利]一种语音、唇语控制装置及控制方法在审
申请号: | 201410240458.4 | 申请日: | 2014-05-30 |
公开(公告)号: | CN105278817A | 公开(公告)日: | 2016-01-27 |
发明(设计)人: | 温淑珍 | 申请(专利权)人: | 金兆栋 |
主分类号: | G06F3/0484 | 分类号: | G06F3/0484;G06F3/0487;G06F3/01;G10L15/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102208 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 控制 装置 方法 | ||
1.一种语音控制装置,包括
图像获取及解析单元(11),用于获取被控装置(14)的视频图像,进行图像识别以获取图像中的菜单及对应坐标,将菜单及对应坐标输出到比对及输出单元(13);
语音获取及识别单元(12),获取语音将其解析获得文字或图形并输出到比对及输出单元(13);
比对及输出单元(13),将从所述图像获取及解析单元(11)接收到的菜单与从所述语音获取及识别单元(12)接收到的文字或图形进行比对,将匹配的菜单所对应的坐标输出到被控装置(14),被控装置(14)根据接收的坐标进行操作。
2.根据权利要求1所述的语音控制装置,其特征在于,所述图像获取及解析单元(11)包括图像采集单元(22)、菜单识别及对应坐标产生单元(23);所述语音获取及识别单元(12)包括声电转换装置(241)、语音信号接收及识别单元(24);
所述图像采集单元(22),采集显示的图像,并将所述图像输出到所述菜单识别及对应坐标产生单元(23);
所述菜单识别及对应坐标产生单元(23),将接收的图像中的菜单进行识别,同时记录所有菜单和各个菜单所处的图像中的坐标;将所述菜单和对应的坐标发送到所述比对及输出单元(13);
所述语音信号接收及识别单元(24),用于接收声电转换装置(241)输出的外部语音信号,进行识别转换成对应的文字或图形,将文字或图形发送到所述比对及输出单元(13);
所述比对及输出单元,将从所述菜单识别及对应坐标产生单元接收到的菜单与从所述语音信号接收及识别单元接收到的文字或图形进行比对,将比对成功的菜单所对应的坐标输出到被控装置。
3.根据权利要求1所述的语音控制装置,其特征在于,比对及输出单元(13)预存了菜单及对应的虚拟坐标,在进行比对时,也将预存的菜单与从所述语音获取及识别单元(12)接收到的文字或图形进行对比。
4.根据权利要求1所述的语音控制装置,其特征在于,所述语音获取及识别单元(12)包含至少一个远离显示屏的话筒。
5.根据权利要求1所述的语音控制装置,其特征在于,所述语音获取及识别单元(12)直接或间接通过互联网与语音识别服务器连接,发送需要识别的信号到语音识别服务器,收到语音识别服务器反馈的文字或图形之后,将其发送到比对及输出单元(13)。
6.一种唇语控制装置,其特征在于,包括
图像获取及解析单元(11),用于获取被控装置(14)的视频图像,进行图像识别以获取图像中的菜单及对应坐标,将菜单及对应坐标输出到比对及输出单元(13);
唇语获取及识别单元(32),获取唇语视频将其解析获得文字或图形并输出到比对及输出单元(13);
比对及输出单元(13),将从所述图像获取及解析单元(11)接收到的菜单与从所述唇语获取及识别单元(32)接收到的文字或图形进行比对,将匹配的菜单所对应的坐标输出到被控装置(14),被控装置(14)根据接收的坐标进行操作。
7.根据权利要求6所述的一种唇语控制装置,其特征在于,
所述图像获取及解析单元(11)包括图像采集单元(22)、菜单识别及对应坐标产生单元(23);所述唇语获取及识别单元(32)包括唇语识别单元(34)和摄像单元(341);
所述图像采集单元(22),采集显示的图像,并将所述图像输出到所述菜单识别及对应坐标产生单元(23);
所述菜单识别及对应坐标产生单元(23),将从所述图像采集单元(22)接收的图像中的菜单进行识别,同时记录所有菜单和各个菜单所处的图像中的坐标,将所述菜单和对应的坐标发送到比对及输出单元(13);
所述唇语识别单元(34),从所述摄像单元(341)获取视频图像,解析视频中的唇语,将解析获得的文字或图形发送到比对及输出单元(13);
所述比对及输出单元(13),将从所述菜单识别及对应坐标产生单元(23)接收到的菜单与从所述唇语识别单元(34)接收到的文字或图形进行比对,将比对成功的菜单所对应的坐标输出到被控装置(14)。
8.根据权利要求6所述的唇语控制装置,其特征在于,比对及输出单元(13)预存了菜单及对应的虚拟坐标,在进行比对时,也将预存的菜单与从所述唇语获取及识别单元(32)接收到的文字或图形进行对比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金兆栋,未经金兆栋许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410240458.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种即时通讯软件中的内容复制方法和装置
- 下一篇:一种显示功能栏的方法和装置