[发明专利]语音合成字典创建装置以及语音合成字典创建方法有效
申请号: | 201380077502.8 | 申请日: | 2013-06-20 |
公开(公告)号: | CN105340003B | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 橘健太郎;森田真弘;笼岛岳彦 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/06 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 刘薇;李峥 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 字典 创建 装置 以及 方法 | ||
1.一种语音合成字典创建装置,包括:
第一语音输入单元,其被配置成接收第一语音数据的输入;
第二语音输入单元,其被配置成接收第二语音数据的输入,所述第二语音数据被认为是适当的语音数据;
确定单元,其被配置成确定所述第一语音数据的说话人是否与所述第二语音数据的说话人相同;以及
创建单元,其被配置成当所述确定单元确定所述第一语音数据的说话人与所述第二语音数据的说话人相同时,使用所述第一语音数据以及与所述第一语音数据对应的文本创建语音合成字典,
其中所述适当的语音数据为朗读呈现文本的语音数据或检测到认证信息的语音数据。
2.根据权利要求1所述的装置,还包括:
存储单元,其被配置成在其中存储多个文本;以及
呈现单元,其被配置成呈现在所述存储单元中存储的所述文本中的任何一个;
其中,所述第二语音输入单元将通过说出由所述呈现单元呈现的所述文本而获得的语音数据设置为被认为是适当的语音数据的所述第二语音数据。
3.根据权利要求2所述的装置,其中,所述呈现单元执行以下的至少一个:随机呈现在所述存储单元中存储的所述文本中的任何一个,以及呈现所述文本中的任何一个仅仅预定的时间段。
4.根据权利要求1所述的装置,其中,所述确定单元通过将所述第一语音数据的特征量与所述第二语音数据的特征量进行比较来确定所述第一语音数据的说话人是否与所述第二语音数据的说话人相同。
5.根据权利要求4所述的装置,其中,所述确定单元基于所述第一语音数据和所述第二语音数据的单词识别率、单词准确率、振幅、基本频率和频谱包络中的至少一个来比较特征量。
6.根据权利要求5所述的装置,其中,当所述第一语音数据的特征量与所述第二语音数据的特征量之间的差等于或小于预定阈值时,或者当所述第一语音数据的特征量与所述第二语音数据的特征量之间的相关性等于或大于预定阈值时,所述确定单元确定所述第一语音数据的说话人与所述第二语音数据的说话人相同。
7.根据权利要求1所述的装置,还包括:文本输入单元,其被配置成输入与所述第一语音数据对应的文本,
其中,所述确定单元将通过说出由所述文本输入单元接收的所述文本而获得的语音数据作为所述第一语音数据,以确定所述第一语音数据的说话人是否与所述第二语音数据的说话人相同。
8.根据权利要求1所述的装置,其中,所述第二语音输入单元包括:
语音输入单元,其被配置成接收语音数据的输入;以及
检测单元,其被配置成检测在由所述语音输入单元接收的所述语音数据中包括的认证信息;
其中,所述检测单元将检测到认证信息的语音数据设置为被认为是适当的所述第二语音数据。
9.根据权利要求8所述的装置,其中,所述认证信息表示语音水印或语音波形加密。
10.一种语音合成字典创建方法,包括:
接收第一语音数据的输入;
接收第二语音数据的输入,所述第二语音数据被认为是适当的语音数据;
确定所述第一语音数据的说话人是否与所述第二语音数据的说话人相同;以及
当确定所述第一语音数据的说话人与所述第二语音数据的说话人相同时,使用所述第一语音数据以及与所述第一语音数据对应的文本创建语音合成字典。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380077502.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于NAND串电流检测编程字线
- 下一篇:具有波长转换层的LED显示器