[发明专利]基于声纹和人脸识别的机器人交互方法在审
申请号: | 201610473742.5 | 申请日: | 2016-06-27 |
公开(公告)号: | CN106127156A | 公开(公告)日: | 2016-11-16 |
发明(设计)人: | 吴义坚;赖伟;张峰 | 申请(专利权)人: | 上海元趣信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G10L17/00;G10L17/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201800 上海市嘉定区安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于声纹和人脸识别的机器人交互方法,其包括人脸识别部分和声纹识别部分;人脸识别部分是基于人的脸部特征,对输入的人脸图像或者视频流判断其是否存在人脸,来自用户集内哪位用户;声纹识别部分是通过一段语音信号来判断这段语音来自用户集内的哪位用户。本发明通过人脸识别技术、表情检测技术和声纹技术实现基于说话人身份和情绪的智能问答,能很好的与提问者进行交流。 | ||
搜索关键词: | 基于 声纹 识别 机器人 交互 方法 | ||
【主权项】:
一种基于声纹和人脸识别的机器人交互方法,其特征在于,所述基于声纹和人脸识别的机器人交互方法包括人脸识别部分和声纹识别部分;人脸识别部分是基于人的脸部特征,对输入的人脸图像或者视频流判断其是否存在人脸,存在人脸则进一步的给出每个脸的位置、大小和各个主要面部器官的位置信息,并依据这些信息,进一步提取每个人脸中所蕴涵的身份特征,并将其与已知的人脸进行对比,从而识别每个人脸的身份和表情,来自用户集内哪位用户;声纹识别部分是通过一段语音信号来判断这段语音来自用户集内的哪位用户,首先通过大量说话人的语料,进行系统模型空间训练,生成系统所需要的空间参数;然后对于需要识别的说话人进行注册,通过注册说话人声纹生成部分,生成用户集内每个注册说话人的声纹;最后,在实际应用中,对需要识别的说话人语音生成声纹,与用户集内每个注册说话人的声纹进行对比,得出是用户集内哪个说话人。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海元趣信息技术有限公司,未经上海元趣信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610473742.5/,转载请声明来源钻瓜专利网。