[发明专利]特定人群识别方法、电子装置及计算机可读存储介质有效
申请号: | 201810813196.4 | 申请日: | 2018-07-23 |
公开(公告)号: | CN109119069B | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 郑能恒;林吉 | 申请(专利权)人: | 深圳大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L15/16;G10L25/24 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 袁文英 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特定 人群 识别 方法 电子 装置 计算机 可读 存储 介质 | ||
一种特定人群识别方法、电子装置及计算机可读存储介质,通过声音数据判定该声音特征属于哪一类特定人群。其中,该特定人群识别方法包括:通过基于ivector的支持向量子系统中的N种类别的分类器,根据所述变化因子特征确定第一初步预测结果;通过基于ivector的逻辑回归子系统中的N‑1级的逻辑回归分类器,根据所述变化因子特征确定第二初步预测结果;通过语音时态神经网络子系统,根据声音数据的滤波器组特征,对所述声音数据的所属类别进行预测,得到第三初步预测结果;根据预设的权重,所述第一初步预测结果,所述第二初步预测结果以及所述第三初步预测结果进行综合判定,获得所述声音数据的所属类别的综合预测结果。
技术领域
本申请涉及电子技术领域,尤其涉及一种特定人群识别方法、电子装置及计算机可读存储介质。
背景技术
在当下的便携式智能终端里,和机器进行语音交互已经变成了一项不可或缺的功能。随着语音识别技术和自然语言处理技术愈发成熟与完善,更多市场化的智能终端在探索语音交互的可实践性时,也更多的会对不同类别的使用者进行个性化服务,以便提升服务的精准性和用户的产品体验满意度。
以性别和年龄作为区分特征为例,现有技术的做法如下:
通过智能终端的麦克风收集交互人的语音数据;将使用者的语音数据通过智能终端上传至云服务器;由云服务器判断该语音数据属于“男儿童”、“女儿童”、“成年男性”、“成年女性”中的哪一类;云服务器根据该语音数据的类性别标签做出相应的个性化回复,反馈给智能终端,最终和使用者完成一次交互。
现有技术采用单一的支持向量机作为打分器,识别效果欠佳。
发明内容
本申请实施例提供一种特定人群识别方法、电子装置及计算机可读存储介质,用于基于声音进行精确的特定人群识别。
本申请实施例第一方面提供一种特定人群识别方法,包括:
应用于特定人群识别系统,所述系统包括:基于ivector的支持向量子系统,基于ivector的逻辑回归子系统,语音时态神经网络子系统;
方法包括:
获取待识别的声音数据,并提取所述声音数据的变化因子特征;
通过所述基于ivector的支持向量子系统中的N种类别的分类器,根据所述变化因子特征确定第一初步预测结果,所述N为大于一的整数;
通过所述基于ivector的逻辑回归子系统中的N-1级的逻辑回归分类器,根据所述变化因子特征确定第二初步预测结果;
通过所述语音时态神经网络子系统,根据声音数据的滤波器组FilterBank特征,对所述声音数据的所属类别进行预测,得到第三初步预测结果;
根据预设的权重,所述第一初步预测结果,所述第二初步预测结果以及所述第三初步预测结果进行综合判定,获得所述声音数据的所属类别的综合预测结果。
本申请实施例第二方面提供另一种电子装置,包括:
基于ivector的支持向量子系统,基于ivector的逻辑回归子系统,语音时态神经网络子系统以及综合判定单元;
所述基于ivector的支持向量子系统用于基于N种类别的分类器,根据声音数据的变化因子特征确定第一初步预测结果,所述N为大于一的整数;
所述基于ivector的逻辑回归子系统用于基于N-1级的逻辑回归分类器,根据声音数据的变化因子特征确定第二初步预测结果;
所述语音时态神经网络子系统用于根据声音数据的滤波器组FilterBank特征,对所述声音数据的所属类别进行预测,得到第三初步预测结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810813196.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语言识别系统
- 下一篇:一种语音端点检测方法、装置、设备及存储介质