[发明专利]讲话者识别装置、讲话者识别方法以及程序在审
申请号: | 202180013727.1 | 申请日: | 2021-02-05 |
公开(公告)号: | CN115104152A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 大毛胜统 | 申请(专利权)人: | 松下电器(美国)知识产权公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L25/51;G10L25/63 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 高迪 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 讲话 识别 装置 方法 以及 程序 | ||
1.一种讲话者识别装置,对示出识别对象的讲话声音的讲话数据所对应的讲话者进行识别,
所述讲话者识别装置具备:
情感推测器,利用进行了学习的深度神经网络,根据从所述讲话数据算出的声学特征量,对所述讲话数据所示的所述讲话声音中包含的情感进行推测;以及
讲话者识别处理部,利用所述情感推测器的推测结果,根据从所述讲话数据算出的所述声学特征量,对用于识别所述讲话数据所对应的讲话者的分数进行输出。
2.如权利要求1所述的讲话者识别装置,
所述讲话者识别处理部具备多个讲话者识别器以及识别器选择部,
所述多个讲话者识别器的每一个具有讲话者特征量抽取部以及相似度计算部,所述讲话者特征量抽取部在所述声学特征量被输入的情况下,从被输入的所述声学特征量中抽取第1讲话者特征量,该第1讲话者特征量能够对所述讲话数据所示的所述讲话声音的讲话者进行确定,所述相似度计算部计算由所述讲话者特征量抽取部抽取的所述第1讲话者特征量和存储在存储部的第2讲话者特征量的相似度,并且,该第2讲话者特征量是能够对包含了作为识别对象的登记讲话者的一种情感的声音的每一个进行确定的特征量,
所述识别器选择部从所述多个讲话者识别器中选择一个讲话者识别器,被选择的所述一个讲话者识别器是在所述存储部中存储了能够对如下的声音的每一个进行确定的第2讲话者特征量的讲话者识别器,所述声音的每一个是与所述推测结果所示的情感相对应的、包含了所述登记讲话者的一种情感的声音,
由所述识别器选择部选择的讲话者识别器,通过被输入从所述讲话数据算出的声学特征量,来计算所述相似度,并作为所述分数输出。
3.如权利要求1所述的讲话者识别装置,
所述讲话者识别处理部具备:
讲话者特征量抽取部,从所述声学特征量中抽取第1讲话者特征量,该第1讲话者特征量能够对所述讲话数据所示的所述讲话声音的讲话者进行确定;
修改部,将存储在存储部的第2讲话者特征量修改为第3讲话者特征量,该第2讲话者特征量能够对包含了作为识别对象的登记讲话者的一种情感的声音的每一个进行确定,该第3讲话者特征量能够对包含了与所述推测结果所示的情感相应的所述一种情感的声音的每一个进行确定;以及
相似度计算部,计算抽取的所述第1讲话者特征量和由所述修改部修改的第3讲话者特征量的相似度,将算出的相似度作为所述分数来输出。
4.如权利要求1所述的讲话者识别装置,
所述讲话者识别处理部具备:
讲话者特征量抽取部,从所述声学特征量中抽取第1讲话者特征量,该第1讲话者特征量能够对所述讲话数据所示的所述讲话声音的讲话者进行确定;
相似度计算部,计算抽取的所述第1讲话者特征量和存储在存储部的第2讲话者特征量的相似度,并且,该第2讲话者特征量是能够对包含了作为识别对象的登记讲话者的一种情感的声音的每一个进行确定的特征量;以及
可靠性赋予部,对算出的所述相似度赋予与所述推测结果所示的情感相应的权重,作为所述分数进行输出,
所述可靠性赋予部在所述一种情感与所述推测结果所示的情感一致的情况下,对算出的所述相似度赋予最大权重。
5.如权利要求4所述的讲话者识别装置,
所述声学特征量是如下这样被算出的,即:由预处理部以时间序列且按识别单位,对示出规定期间中的一个讲话者的讲话声音的全部讲话数据进行分割,从而获得多个讲话数据,所述声学特征量是从获得的所述多个讲话数据的每一个中算出的,
所述可靠性赋予部对所述相似度赋予权重,作为所述分数进行输出,所述相似度是由所述相似度计算部算出的、针对所述多个讲话数据的每一个的相似度,所述权重是与由所述情感推测器推测出的、针对所述多个讲话数据的每一个的所述推测结果所示的情感相应的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器(美国)知识产权公司,未经松下电器(美国)知识产权公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180013727.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于治疗性用途的充气微囊泡
- 下一篇:放射性同位素发生器早期突破检测