[发明专利]讲话者识别装置、讲话者识别方法以及程序在审
申请号: | 202180013727.1 | 申请日: | 2021-02-05 |
公开(公告)号: | CN115104152A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 大毛胜统 | 申请(专利权)人: | 松下电器(美国)知识产权公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L25/51;G10L25/63 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 高迪 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 讲话 识别 装置 方法 以及 程序 | ||
本公开的讲话者识别装置是对示出识别对象的讲话声音的讲话数据所对应的讲话者进行识别的讲话者识别装置(11),具备:情感推测器(12),利用进行了学习的DNN(Deep Neural Network:深度神经网络),根据从讲话数据算出的声学特征量,对讲话数据所示的讲话声音中包含的情感进行推测;以及讲话者识别处理部(13),利用情感推测器(12)的推测结果,根据从所述讲话数据算出的所述声学特征量,对用于识别该讲话数据所对应的讲话者的分数进行输出。
技术领域
本公开涉及讲话者识别装置、讲话者识别方法以及程序。
背景技术
讲话者识别技术是一种对评价讲话是哪个讲话者的登记讲话进行推测的技术,该讲话者识别技术基于从登记讲话算出的特征量与从评价讲话算出的特征量的相似度来进行推测,所述登记讲话是作为登记对象的每个讲话者的讲话,所述评价讲话是作为识别对象的未知的讲话者的讲话(例如专利文献1)。
例如,作为讲话者识别技术,专利文献1公开了一种通过利用每个登记讲话者的登记讲话中的讲话者特征向量和评价讲话中的讲话者特征向量的相似度,对评价讲话的讲话者进行识别的技术。
(现有技术文献)
(专利文献)
专利文献1:日本特开2017-187642号公报
然而,在将笑声或愤怒的叫喊声等情感讲话设为评价讲话的情况下,对识别准确度会造成影响。具体而言,如果登记讲话中包含的情感与评价讲话中包含的情感不同时,随着评价讲话包含的情感不同而产生的声音抑扬变化,会导致讲话者的识别准确度的下降。
也就是说,在专利文献1公开的现有讲话者识别技术中,不考虑评价讲话中包含的情感,而计算登记讲话和评价讲话中的讲话者特征向量的相似度并对评价讲话的讲话者进行识别。因此,以目前的讲话者识别技术来说,识别评价讲话的讲话者的准确度有时并不充分。
发明内容
鉴于上述问题,本公开的目的在于提供一种即使评价讲话即识别对象的讲话中包含了讲话者的情感,也能够提高讲话者的识别准确度的讲话者识别装置、讲话者识别方法以及程序。
本公开的一个形态所涉及的讲话者识别装置,对示出识别对象的讲话声音的讲话数据所对应的讲话者进行识别,所述讲话者识别装置具备:情感推测器,利用进行了学习的DNN(Deep Neural Network:深度神经网络),根据从所述讲话数据算出的声学特征量,对所述讲话数据所示的所述讲话声音中包含的情感进行推测;以及讲话者识别处理部,利用所述情感推测器的推测结果,根据从所述讲话数据算出的所述声学特征量,对用于识别所述讲话数据所对应的讲话者的分数进行输出。
另外,这些概括性的或具体的形态,也可以由系统、方法、集成电路、计算机程序或计算机可读取的CD-ROM等记录介质来实现,也可以由系统、方法、集成电路、计算机程序以及记录介质的任意组合来实现。
通过本公开的讲话者识别装置等,即使识别对象的讲话中包含了讲话者的情感,也能够提高讲话者的识别准确度。
附图说明
图1是示出实施方式所涉及的讲话者识别系统的构成的一个例子的方框图。
图2是示出实施方式所涉及的讲话者识别系统的构成的另外一个例子的方框图。
图3是示出实施方式所涉及的预处理部的具体构成的一个例子方框图。
图4是示出实施方式所涉及的讲话者识别装置的具体构成的一个例子方框图。
图5示出了实施方式所涉及的情感推测器的构成的一个例子。
图6示出了实施方式所涉及的讲话者识别器的构成的一个例子。
图7示出了实施方式所涉及的讲话者识别器具有的讲话者特征量抽取部的构成的一个例子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器(美国)知识产权公司,未经松下电器(美国)知识产权公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180013727.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于治疗性用途的充气微囊泡
- 下一篇:放射性同位素发生器早期突破检测