[发明专利]发音者检索装置、发音者检索方法以及发音者检索程序有效
申请号: | 201780088429.2 | 申请日: | 2017-09-25 |
公开(公告)号: | CN110431546B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 森纮一郎;铃木优;大谷大和;森田真弘 | 申请(专利权)人: | 株式会社东芝;东芝数字解决方案株式会社 |
主分类号: | G06F16/63 | 分类号: | G06F16/63;G06F16/683 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 杨谦 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发音 检索 装置 方法 以及 程序 | ||
1.一种发音者检索装置,其中,具备:
第一变换部,使用用于将表示声质特征的得分向量变换成声学模型的第一变换模型的逆变换模型,将预先登记的所述声学模型变换成所述得分向量,并与发音者识别信息建立对应地登记在得分管理信息中;
受理部,受理所述得分向量的输入;以及
检索部,从所述得分管理信息中检索与受理的所述得分向量相似的发音者识别信息。
2.根据权利要求1所述的发音者检索装置,其中,
所述得分向量表示发音者的声质的主观特征。
3.根据权利要求1所述的发音者检索装置,其中,具备:
第二变换部,使用所述第一变换模型,将受理的所述得分向量变换成所述声学模型;以及
再现部,对从所述声学模型合成的语音进行再现。
4.根据权利要求1所述的发音者检索装置,其中,
所述声学模型是将从语音的语言特征量到语音的声音特征量的映射统计性地模型化而成的。
5.根据权利要求4所述的发音者检索装置,其中,
具备第三变换部,该第三变换部使用用于将所述声音特征量变换成所述得分向量的第三变换模型,将发音者的所述声音特征量变换成所述得分向量,并登记在所述得分管理信息中。
6.根据权利要求5所述的发音者检索装置,其中,
具备第三学习部,该第三学习部学习用于将所述声音特征量变换成所述得分向量的所述第三变换模型。
7.根据权利要求1所述的发音者检索装置,其中,
所述得分向量按照声质的特征的每个种类用得分表示声质特征的主观强度,
所述受理部受理示出所述特征的每个种类的得分的所述得分向量和针对所述特征的种类的加权值,
所述检索部检索与将受理的所述得分向量中包含的所述得分利用对应的加权值进行加权后得到的所述得分向量相似的发音者识别信息。
8.一种发音者检索方法,其中,包括:
使用用于将表示声质特征的得分向量变换成声学模型的第一变换模型的逆变换模型,将预先登记的所述声学模型变换成所述得分向量,并与发音者识别信息建立对应地登记在得分管理信息中的步骤;
受理所述得分向量的输入的步骤;以及
从所述得分管理信息中检索与受理的所述得分向量相似的发音者识别信息的步骤。
9.一种发音者检索程序,其中,用于使计算机执行下述步骤:
使用用于将表示声质特征的得分向量变换成声学模型的第一变换模型的逆变换模型,将预先登记的所述声学模型变换成所述得分向量,并与发音者识别信息建立对应地登记在得分管理信息中的步骤;
受理所述得分向量的输入的步骤;以及
从所述得分管理信息中检索与受理的所述得分向量相似的发音者识别信息的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝数字解决方案株式会社,未经株式会社东芝;东芝数字解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780088429.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:针对结构化数据和非结构化数据执行查询
- 下一篇:电子设备和控制方法