[发明专利]说话者模型制作系统在审

专利信息
申请号: 201910110478.2 申请日: 2019-02-12
公开(公告)号: CN110706714A 公开(公告)日: 2020-01-17
发明(设计)人: 藤村浩司 申请(专利权)人: 株式会社东芝
主分类号: G10L17/04 分类号: G10L17/04;G10L15/06;G10L17/18;G10L17/00
代理公司: 11038 中国国际贸易促进委员会专利商标事务所 代理人: 金光华
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 说话 模型制作 扩展部 中间层 制作 变更 图案 神经网络 声音检测 网络参数 输出 输入层 单词
【权利要求书】:

1.一种说话者模型制作系统,具备:

扩展部,根据多个图案来变更从输入层至规定的中间层为止的网络参数的一部分,针对与多个所述图案对应的变更后的神经网络分别输入1个声音,从而从所述中间层得到多个输出;以及

制作部,根据多个所述输出,制作针对从所述声音检测出的单词的说话者模型。

2.根据权利要求1所述的说话者模型制作系统,其中,

所述制作部制作由多个所述输出的平均以及方差表示的高斯分布作为所述说话者模型。

3.根据权利要求1所述的说话者模型制作系统,其中,

所述制作部通过使用说话者的声音以及多个所述输出的学习来制作所述说话者模型。

4.根据权利要求1所述的说话者模型制作系统,其中,

所述制作部针对所述单词所包含的每个部分区间,制作所述说话者模型。

5.根据权利要求1所述的说话者模型制作系统,其中,

所述扩展部变更从所述输入层至所述中间层为止的网络参数之中的一部分的权重。

6.根据权利要求1所述的说话者模型制作系统,其中,

所述扩展部对从所述输入层至所述中间层为止的网络参数之中的一部分的偏移相加随机值。

7.根据权利要求1所述的说话者模型制作系统,其中,

所述网络参数针对向从所述输入层至所述中间层为止的各层的输入值,包括偏移项参数,

所述扩展部对一部分的偏移项参数相加随机值。

8.根据权利要求1所述的说话者模型制作系统,其中,所述说话者模型制作系统还具备:

声音取得部,受理声音并变换为特征量;

计算部,将所述特征量输入到神经网络,计算表示所述特征量与预先确定的单词对应的可能性的得分;以及

检测部,使用所述得分,从所述声音检测所述单词。

9.根据权利要求8所述的说话者模型制作系统,其中,

在所述得分的计算中使用的神经网络与所述扩展部变更网络参数的神经网络相同。

10.根据权利要求8所述的说话者模型制作系统,其中,

在所述得分的计算中使用的神经网络与所述扩展部变更网络参数的神经网络不同。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910110478.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top