[发明专利]一种唇语输入方法和系统有效

申请号：	201510200486.8	申请日：	2015-04-24
公开（公告）号：	CN104808794B	公开（公告）日：	2019-12-10
发明（设计）人：	张弛	申请（专利权）人：	北京旷视科技有限公司;北京迈格威科技有限公司
主分类号：	G06F3/01	分类号：	G06F3/01
代理公司：	11481 北京睿邦知识产权代理事务所(普通合伙)	代理人：	徐丁峰
地址：	100080 北京***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种唇语输入方法和系统。该方法的步骤包括：步骤S100：通过视频采集模块捕捉用户做出与待输入内容的发音相对应的口型时的嘴唇动作的视频；步骤S200：对所述视频中的用户的嘴唇动作进行分析，识别出与用户的口型对应的语言信息；步骤S300：将所述语言信息输入待输入装置。该系统包括视频采集模块、唇语识别模块和输入模块。本发明的方法和系统只需对待输入装置的视频采集模块做出说话时嘴唇的运动就可以输入相应的语言信息，具有输入方便的特点。
搜索关键词：	一种输入方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种唇语输入方法，其特征在于，包括如下步骤：/n步骤S100：通过视频采集模块捕捉用户做出与待输入内容的发音相对应的口型时的嘴唇动作的视频；/n步骤S200：对所述视频中的用户的嘴唇动作进行分析，识别出与用户的口型对应的语言信息；/n步骤S300：将所述语言信息输入待输入装置；/n所述步骤S200包括：/n步骤S201：确定所述视频中的每帧图像中嘴唇的位置，并提取嘴唇上的关键点；/n步骤S202：跟踪每帧图像之间所述关键点的位置变化，得到每帧图像中所述关键点的特征向量；/n步骤S203：基于所述特征向量，将所述特征向量合并成特征向量序列，通过事先确定的语言模型识别出与用户的口型对应的语言信息；/n所述步骤S203基于回馈式深度人工神经网络的方法实现，所述语言模型为训练好的神经元网络；所述神经元网络的结构包括：输入层，接受所述特征向量序列；卷积层，对输入向量进行平滑和提取特征；反馈层，通过联系之前和之后的输入特征，对当前输入特征进行提取；全连接层，对特征进行进一步抽象；输出层，输出最终的判断结果。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司，未经北京旷视科技有限公司;北京迈格威科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510200486.8/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F3-00 用于将所要处理的数据转变成为计算机能够处理的形式的输入装置；用于将数据从处理机传送到输出设备的输出装置，例如，接口装置
G06F3-01 .用于用户和计算机之间交互的输入装置或输入和输出组合装置
G06F3-05 .在规定的时间间隔上，利用模拟量取样的数字输入
G06F3-06 .来自记录载体的数字输入，或者到记录载体上去的数字输出
G06F3-09 .到打字机上去的数字输出
G06F3-12 .到打印装置上去的数字输出

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种唇语输入方法和系统有效

专利文献下载