[发明专利]说话者模型制作系统在审
申请号: | 201910110478.2 | 申请日: | 2019-02-12 |
公开(公告)号: | CN110706714A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 藤村浩司 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L15/06;G10L17/18;G10L17/00 |
代理公司: | 11038 中国国际贸易促进委员会专利商标事务所 | 代理人: | 金光华 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 说话 模型制作 扩展部 中间层 制作 变更 图案 神经网络 声音检测 网络参数 输出 输入层 单词 | ||
1.一种说话者模型制作系统,具备:
扩展部,根据多个图案来变更从输入层至规定的中间层为止的网络参数的一部分,针对与多个所述图案对应的变更后的神经网络分别输入1个声音,从而从所述中间层得到多个输出;以及
制作部,根据多个所述输出,制作针对从所述声音检测出的单词的说话者模型。
2.根据权利要求1所述的说话者模型制作系统,其中,
所述制作部制作由多个所述输出的平均以及方差表示的高斯分布作为所述说话者模型。
3.根据权利要求1所述的说话者模型制作系统,其中,
所述制作部通过使用说话者的声音以及多个所述输出的学习来制作所述说话者模型。
4.根据权利要求1所述的说话者模型制作系统,其中,
所述制作部针对所述单词所包含的每个部分区间,制作所述说话者模型。
5.根据权利要求1所述的说话者模型制作系统,其中,
所述扩展部变更从所述输入层至所述中间层为止的网络参数之中的一部分的权重。
6.根据权利要求1所述的说话者模型制作系统,其中,
所述扩展部对从所述输入层至所述中间层为止的网络参数之中的一部分的偏移相加随机值。
7.根据权利要求1所述的说话者模型制作系统,其中,
所述网络参数针对向从所述输入层至所述中间层为止的各层的输入值,包括偏移项参数,
所述扩展部对一部分的偏移项参数相加随机值。
8.根据权利要求1所述的说话者模型制作系统,其中,所述说话者模型制作系统还具备:
声音取得部,受理声音并变换为特征量;
计算部,将所述特征量输入到神经网络,计算表示所述特征量与预先确定的单词对应的可能性的得分;以及
检测部,使用所述得分,从所述声音检测所述单词。
9.根据权利要求8所述的说话者模型制作系统,其中,
在所述得分的计算中使用的神经网络与所述扩展部变更网络参数的神经网络相同。
10.根据权利要求8所述的说话者模型制作系统,其中,
在所述得分的计算中使用的神经网络与所述扩展部变更网络参数的神经网络不同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910110478.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人脸图像生成方法及电子设备
- 下一篇:信号编码和解码的方法和设备