[发明专利]定制化语音控制的实现方法、移动终端及可读存储介质有效
申请号: | 201711438727.8 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108174030B | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 刘佳明 | 申请(专利权)人: | 努比亚技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518057 广东省深圳市南山区高新区北环大道9018*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种定制化语音控制的实现方法、移动终端及计算机可读存储介质,该定制化语音控制的实现方法包括:终端按预设次数采集用户输入的测试语音数据,并提取所有测试语音数据中的测试语言特征和测试声学特征;终端对测试语言特征和测试声学特征进行特征训练,以获得测试语言因子和测试声学因子;终端将测试语言因子和测试声学因子分别与标准语音库中的标准语言因子和标准声学因子相互映射,以生成实现终端语音控制的定制映射表。本发明将用户的语音特征与标准语音库进行关联,使终端在用户发音不准确的情况能准确识别用户的语音数据,构建用户个人的语音识别库,提高对用户个人语音的特征解析能力,提高终端的语音识别率。 | ||
搜索关键词: | 定制 语音 控制 实现 方法 移动 终端 可读 存储 介质 | ||
终端按预设次数采集用户输入的测试语音数据,并提取所有测试语音数据中的测试语言特征和测试声学特征;
终端对测试语言特征和测试声学特征进行特征训练,以获得测试语言因子和测试声学因子;
终端将测试语言因子和测试声学因子分别与标准语音库中的标准语言因子和标准声学因子相互映射,以生成实现终端语音控制的定制映射表。
2.如权利要求1所述的定制化语音控制的实现方法,其特征在于,所述终端将测试语言因子和测试声学因子分别与标准语音库中的标准语言因子和标准声学因子相互映射,以生成实现终端语音控制的定制映射表的步骤包括:终端分别为测试语言因子和测试声学因子设置测试语言标识和测试声学标识;
终端获取标准语音库中分别与测试语言因子和测试声学因子相互映射的标准语言因子和标准声学因子;
终端分别为标准语言因子和标准声学因子设置标准语言标识和标准声学标识;
终端将测试语言标识和测试声学标识分别与相互映射的标准语言标识和标准声学标识相互关联,生成实现终端语音控制的定制映射表。
3.如权利要求2所述的定制化语音控制的实现方法,其特征在于,所述终端对测试语言特征和测试声学特征进行特征训练,以获得测试语言因子和测试声学因子的步骤包括:终端将测试语言特征中的音节进行语义训练,以获得测试语言因子;
终端将测试声学特征中的音调和音色进行语音训练,以获得测试声学因子。
4.如权利要求2所述的定制化语音控制的实现方法,其特征在于,所述终端将测试语言因子和测试声学因子分别与标准语音库中的标准语言因子和标准声学因子相互映射的步骤之后还包括:终端提取接收到的语音数据中的语言特征和声学特征,并获取语言特征与测试语言因子的第一相似度,以及声学特征与测试声学因子的第二相似度;
当终端检测到第一相似度大于第一阈值,且第二相似度大于第二阈值时,获取语言标识和声学标识分别在定制映射表中对应的标准语言标识和标准声学标识;
终端根据标准语言标识和标准声学标识,获取对应的标准语言因子和标准声学因子。
5.如权利要求4所述的定制化语音控制的实现方法,其特征在于,所述终端根据标准语言标识和标准声学标识,获取对应的标准语言因子和标准声学因子的步骤之后还包括:当终端检测到第二相似度小于警戒阈值时,启动终端的访客模式。
6.如权利要求4所述的定制化语音控制的实现方法,其特征在于,所述终端提取接收到的语音数据中的语言特征和声学特征,并获取语言特征与测试语言因子的第一相似度,以及声学特征与测试声学因子的第二相似度的步骤之后还包括:
当终端检测到第一相似度小于或等于第一阈值时,输出无法识别的提示信息。
7.如权利要求1所述的定制化语音控制的实现方法,其特征在于,所述终端按预设次数采集用户输入的测试语音数据,并提取所有测试语音数据中的测试语言特征和测试声学特征的步骤包括:终端按预设次数采集用户输入的测试语音数据;
终端对测试语音数据进行滤波处理,以获得降噪过的测试语音数据;
终端提取所有降噪后的测试语音数据中的测试语言特征和测试声学特征。
8.如权利要求1至7任一项所述的定制化语音控制的实现方法,其特征在于,所述终端按预设次数采集用户输入的测试语音数据,并提取所有测试语音数据中的测试语言特征和测试声学特征的步骤之后还包括:当终端检测到测试语言特征和/或测试声学特征无法进行特征训练时,根据用户输入的标准音节进行特征映射。
9.一种移动终端,其特征在于,所述移动终端包括:存储器、处理器,通信总线以及存储在所述存储器上的语音定制方法定制化语音控制的实现程序,所述通信总线用于实现处理器与存储器间的通信连接;
所述处理器用于执行所述语音定制方法定制化语音控制的实现程序,以实现如权利要求1至8中任一项所述的定制化语音控制的实现方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有语音定制方法定制化语音控制的实现程序,所述语音定制方法定制化语音控制的实现程序被处理器执行时实现如权利要求1至8中任一项所述的定制化语音控制的实现方法的步骤。该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于努比亚技术有限公司,未经努比亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711438727.8/,转载请声明来源钻瓜专利网。