[发明专利]一种确定说话人特征的方法及装置有效
申请号: | 201810501729.5 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108899033B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 胡亚光;李志飞 | 申请(专利权)人: | 出门问问信息科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/18;G10L15/26 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 100094 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 说话 特征 方法 装置 | ||
本发明实施例公开了一种确定说话人特征的方法及装置,涉及数据处理技术领域,能够根据说话人提供的声音文本数据识别并确定说话人具有的特征信息,以便于开发人员依据得到的说话人特征能够更加有针对性地改进当前的智能化服务,以便于大大提高向说话人推送的个性化服务方案的应用价值。本发明实施例主要技术方案为:接收声音文本数据;从所述声音文本数据中提取声纹特征数据;利用预置模型对所述声纹特征数据进行处理,根据所述预置模型的输出数据,确定与所述声纹特征数据匹配的说话人特征。本发明实施例主要用于根据声音文本数据识别并确定说话人具有的特征信息。
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种确定说话人特征的方法及装置。
背景技术
随着科技的不断创新、发展,智能影音设备已经可以具备信息处理能力,尤其是对于支持智能语音控制的设备,用户可以通过下达语音命令控制指定的影音设备执行播放音乐/视频、接入/断开互联网、搜索数据信息等等操作,以享受智能影音设备提供的智能化服务。
目前,在依据用户下达的语音命令实现对智能影音设备的控制之前,需要在该指定的智能影音设备上完成用户注册操作,以用于在智能影音设备接收到语音命令时验证用户身份,若验证通过,才会执行相关的语音命令,进一步的,在注册用户时,用户将填写用户特征数据,比如年龄、性别等等,以便智能影音设备的开发人员可以依据用户特征数据对该用户在本影音设备上产生的行为数据进行分析,有助于开发人员对智能影音设备上的智能化功能进行改进,以用于能够实现为用户定制个性化的服务方案。
然而,在注册用户时如果用户未在影音设备上预留用户特征数据,又或者,预留的用户特征数据不够完整,这将使得开发人员无法获取到准确的、完整的用户特征数据,继而使得开发人员无法依据用户特征数据对用户行为数据进行准确地、有效地分析,如此将大大降低向用户提供的个性化服务方案的应用价值。
发明内容
有鉴于此,本发明实施例提供一种确定说话人特征的方法及装置,主要目的在于优化对说话人声音文本数据的处理,以用于根据说话人声音文本数据识别并确定说话人具有的特征信息,以便于开发人员依据得到的说话人特征能够更加有针对性地改进当前的智能化服务,以大大提高向说话人推送的个性化服务方案的应用价值。
为了达到上述目的,本发明实施例主要提供如下技术方案:
第一方面,本发明实施例提供了一种确定说话人特征的方法,该方法包括:
接收声音文本数据;
从所述声音文本数据中提取声纹特征数据;
利用预置模型对所述声纹特征数据进行处理,根据所述预置模型的输出数据,确定与所述声纹特征数据匹配的说话人特征。
优选的,所述利用预置模型对所述声纹特征数据进行处理,包括:
将所述声纹特征数据输入所述预置模型,所述预置模型是预先利用深度神经网络对声音样本数据训练生成的分类模型;
按照预置特征维度,利用所述分类模型对所述声纹特征数据进行处理,输出所述预置特征对应的置信度值,所述预置特征是根据所述预置特征维度确定的多个特征。
优选的,所述根据所述预置模型的输出数据,确定与所述声纹特征数据匹配的说话人特征,包括:
按照数值由大到小的顺序,将多个所述预置特征对应的置信度值排序;
在多个所述预置特征对应的置信度值中选取排序在前两位的置信度值;
将所述选取的前两位置信度值做相减运算,并得到执行所述相减运算对应的差值的绝对值;
判断所述差值的绝对值是否大于第一预置阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810501729.5/2.html,转载请声明来源钻瓜专利网。