[发明专利]一种年龄识别的方法及装置在审

专利信息
申请号: 201510060710.8 申请日: 2015-02-05
公开(公告)号: CN104700843A 公开(公告)日: 2015-06-10
发明(设计)人: 贾魁;王勇进;匡涛;任晓楠 申请(专利权)人: 海信集团有限公司
主分类号: G10L25/48 分类号: G10L25/48;G10L15/02;H04N21/439;H04N21/466
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 黄志华
地址: 266100 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 年龄 识别 方法 装置
【说明书】:

技术领域

发明涉及通信技术领域,尤其涉及一种年龄识别的方法及装置。

背景技术

声纹识别技术具有简便、准确、经济以及扩展性良好等优势,有着广泛的应用前景。声纹识别技术可应用电视中实现通过语音对电视进行操控。语音操控电视是实现电视智能化的重要一步,而智能语音助手在电视上的应用使语音电视的交互模型得到进一步升级,用户通过语音助手对电视进行操控,可以更加简单快捷地实现用户的意图。

随着影视类型的多样化,影视不仅是一种娱乐工具,其内容的积极性或消极性更是对用户的人生观和价值观产生一定的影响。例如,青少年正值价值观的形成期,影视文化对青少年的成长和发展的影响更为深远,如果能够对未成年人观看的节目进行必要的限制,可以减少个别影视内容对青少年的消极影响。一般来说,不同年龄段的用户对影视内容的偏好不同,如果智能语音助手可以根据用户的声音判断出用户的所属的年龄范围,针对一个年龄段的用户推荐该年龄段用户适宜观看的节目,那么对于用户来说会有更好的用户体验。

若要实现为不同年龄段用户推荐合适的电视节目以提高用户体验,亟待一种识别用户年龄的技术,例如基于语音的年龄识别技术。

发明内容

本发明实施例提供一种基于年龄识别模型实现的显示方法及装置,用以实现基于待识别声音进行用户年龄识别,进而为不同年龄段用户推荐合适的电视节目,提高用户体验。

本发明实施例提供了一种年龄识别方法,该方法包括:

提取待识别声音信号中的浊音信息;

对所述浊音信息进行特征提取,得到所述待识别声音信号的基频参数特征向量和梅尔频率倒谱系数特征向量;

将所述基频参数特征向量与第一年龄识别模型进行匹配,得到多个与年龄类别对应的第一年龄识别结果;

将所述梅尔频率倒谱系数特征向量与第二年龄识别模型进行匹配,得到多个与年龄类别对应的第二年龄识别结果;

将同一年龄类别对应的第一年龄识别结果和第二年龄识别结果进行加权计算,得到多个与年龄类别对应的第三年龄识别结果;

将最大的第三年龄识别结果所对应的年龄类别作为所述待识别声音信号的年龄段识别结果。

上述实施例中,将用户发出的待识别声音信号中的真正具有人体声音特征的浊音信息分离出,并从浊音信息中提取出反映说话人发音的声带震动信息的基频参数以及反映人耳感知的声道特性信息的梅尔频率倒谱系数,将基频参数与第一年龄识别模型匹配,将梅尔频率倒谱系数与第二年龄识别模型匹配,然后将匹配结果较高的年龄识别结果作为最终年龄识别结果,提高了年龄识别的准确率。

基于上述方法流程本发明实施例提供了一种年龄识别装置,包括:

获取单元,用于提取待识别声音信号中的浊音信息;

提取单元,用于对所述浊音信息进行特征提取,得到所述待识别声音信号的基频参数特征向量和梅尔频率倒谱系数特征向量;

第一匹配单元,用于将所述基频参数特征向量与第一年龄识别模型进行匹配,得到多个与年龄类别对应的第一年龄识别结果;

第二匹配单元,用于将所述梅尔频率倒谱系数特征向量与第二年龄识别模型进行匹配,得到多个与年龄类别对应的第二年龄识别结果;

处理单元,用于将同一年龄类别对应的第一年龄识别结果和第二年龄识别结果进行加权计算,得到多个与年龄类别对应的第三年龄识别结果,将最大的 第三年龄识别结果所对应的年龄类别作为所述待识别声音信号的年龄段识别结果。

上述实施例中,将用户发出的待识别声音信号中的真正具有人体声音特征的浊音信息分离出,并从浊音信息中提取出反映说话人发音的声带震动信息的基频参数以及反映人耳感知的声道特性信息的梅尔频率倒谱系数,将基频参数与第一年龄识别模型匹配,将梅尔频率倒谱系数与第二年龄识别模型匹配,然后将匹配结果较高的年龄识别结果作为最终年龄识别结果,提高了年龄识别的准确率。待识别声音待识别声音待识别声音待识别声音

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为发明实施例提供的一种建立年龄识别模型的方法流程图;

图2为发明实施例提供的一种语音的产生模型的结构示意图;

图3为本发明实施例提供的一种分离浊音信息的方法流程图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信集团有限公司;,未经海信集团有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510060710.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top