[发明专利]一种汉语唇语单音节识别分类器构建方法在审

申请号：	202010395570.0	申请日：	2020-05-12
公开（公告）号：	CN111582195A	公开（公告）日：	2020-08-25
发明（设计）人：	朱红;刘乐;王恒毅	申请（专利权）人：	中国矿业大学（北京）
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	北京科亿知识产权代理事务所(普通合伙) 11350	代理人：	汤东凤
地址：	100083 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种汉语唇语单音节识别分类构建方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种汉语唇语单音节识别分类器构建方法，其特征在于，包括如下步骤：

S1、采集待识别汉字单音节的发音视频；

S2、构建唇部特征点标注图像样本集：

所述唇部特征点标注图像样本集的原始图像包括来自步骤S1中筛选的发音视频，还包括来自其他视频的采样，图像中要求唇部信息完整，即唇部轮廓清晰可见；

为每一幅原始图像的唇部边缘手工标注20个特征点得到唇部特征点标注图像，所有唇部特征点标注图像的集合为唇部特征点标注图像样本集；特征点包括两侧唇角的外沿点C1、C2，两侧唇角的内沿点C3、C4，两个唇峰的上唇外沿最高点U3、U5；两个唇峰间的上唇外沿最低点U4，C1与U3之间的上唇外沿中间点U2，C2与U5之间的上唇外沿中间点U6，上唇内沿点U7、U8，下唇外沿点L2、L3、L4、L5、L6；下唇内沿点L7、L8；U3与U7所在直线垂直于C3与C4所在直线，U5与U8所在直线垂直于C3与C4所在直线；L2为C1与L3之间的下唇外沿中间点，L5与U5所在直线垂直于C1与C2所在直线，L6与U6所在直线垂直于C1与C2所在直线；L6为C2与L5之间的下唇外沿中间点；L4为C1与C2之间的下唇外沿中间点；L7与U7所在直线垂直于C3与C4所在直线，L8与U8所在直线垂直于C3与C4所在直线；

S3、训练唇部特征点提取模型：

训练集的唇部向量为：

x_i＝(x_i0,y_i0,x_i1,y_i1,…,x_i19,y_i19)^T；

式中，x_i表示第i幅唇部特征点标注图像中的所有特征点构成的唇部向量，(x_ik，y_ik)表示图像中第k个特征点的横、纵坐标；

训练唇部特征点提取模型的具体步骤为：

S3.1、从唇部特征点标注图像样本集中选择一个唇部模型作为基准模型，将唇部特征点标注图像样本集中其他所有唇部模型对齐到基准模型，对齐是指将一系列唇部模型通过旋转、平移、缩放变换，在不改变模型的基础上对齐到基准模型上；

S3.2、计算平均唇部模型；

S3.3、将唇部特征点标注图像样本集中所有唇部模型对齐到步骤S3.2计算得到的平均唇部模型；

S3.4、重复步骤S3.2-S3.3直到收敛，收敛的条件为使下式最小化：

E_j＝(x_i-M(s_j,θ_j)[x_j]-t_j)^TW(x_i-M(s_j,θ_j)[x_j]-t_j)；

式中，x_i、x_j为第i幅和第j幅唇部特征点标注图像中的所有特征点构成的唇部向量，i≠j；s_j表示第j幅唇部特征点标注图像的唇部模型的缩放系数；M(s_j,θ_j)[x_j]为第j幅唇部特征点标注图像的唇部模型的变化函数；t_j表示第j幅唇部特征点标注图像的唇部模型的平移向量，t_j＝(t_xj,t_yj,…,t_xj,t_yj)^T，t_xj,t_yj分别表示第j幅唇部特征点标注图像的唇部模型每个点的横坐标和纵坐标的偏移量，每个点的横坐标和纵坐标的偏移量相等；θ_j表示第j幅唇部特征点标注图像的唇部模型的旋转系数；W为一个对角矩阵，其对角线中的每一项为k表示唇部模型中的一个特征点，其中，n为唇部模型中特征点的个数，R_kl表示唇部模型中两个特征点k和l之间的距离；表示距离R_kl的方差；