[发明专利]语音合成系统的评测方法和系统有效
申请号: | 201810179637.X | 申请日: | 2018-03-05 |
公开(公告)号: | CN108597538B | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 缪冠琼 | 申请(专利权)人: | 标贝(北京)科技有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60 |
代理公司: | 11694 北京万思博知识产权代理有限公司 | 代理人: | 孙黎生 |
地址: | 100000 北京市海淀区西小口*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客观评测 评测 语音合成系统 第一数据 结果输出步骤 数据处理步骤 比对步骤 不确定性 接收用户 评测结果 主观因素 比对 上传 解析 输出 响应 申请 | ||
本申请公开了一种语音合成系统的评测方法和系统,其中,该评测方法包括客观评测步骤,所述客观评测步骤包括:第一数据接收步骤:接收用户上传的第一数据;第一数据处理步骤:响应于用户对至少一个客观评测模式的选择,对所述第一数据进行解析和拆分,得到与所述客观评测模式对应的第二数据;客观比对步骤:将所述第二数据与第三数据进行比对得到客观评测结果;和客观评测结果输出步骤:将所述客观评测结果输出给所述用户。该方法从客观方面对语音合成系统进行了评测,减少了主观因素的干扰和不确定性,评测速度更快,评测结果更准确、更稳定,也更加有证明力。
技术领域
本申请涉及数据处理领域,特别是涉及一种语音合成系统的评测方法和系统。
背景技术
语音合成是通过机械的、电子的方法产生人造语音的技术。语音合成能够使电脑具有类似于人一样的说话能力,是当今时代信息产业的重要竞争市场。随着人工智能产业的飞速发展,语音合成系统也得到了更加广泛的应用。人们对语音合成的可懂度、自然度、节奏感以及音质的要求也越来越高。
目前针对语音合成系统的测评方法仅针对语音的自然度进行评分,即,针对合成的语音效果进行评分,而这种评分标准局限于对自然度优劣的评价,并没有客观的指标,评分人的主观性较强。测评结果提供给用户的反馈只有对合成系统优劣的认知,并不能帮助用户找到合成的问题所在,以及解决语音合成系统根本性、实质性的问题,达不到提升语音合成效果的作用。
发明内容
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
根据本申请的一个方面,提供了一种语音合成系统的评测方法,该评测方法包括客观评测步骤,所述客观评测步骤包括:
第一数据接收步骤:接收用户上传的第一数据,其中,所述第一数据是将至少一个测试集输入到待评测的语音合成系统后输出的第一前端结果;
第一数据处理步骤:响应于用户对至少一个客观评测模式的选择,对所述第一数据进行解析和拆分,得到与所述客观评测模式对应的第二数据;
客观比对步骤:将所述第二数据与第三数据进行比对得到客观评测结果,其中,所述第三数据是基于所述客观评测模式对预置的所述测试集的完整的客观评测答案进行解析和拆分后得到的数据;和
客观评测结果输出步骤:将所述客观评测结果输出给所述用户。
该方法从客观方面对语音合成系统进行了评测,减少了主观因素的干扰和不确定性,评测速度更快,评测结果更准确、更稳定,也更加有证明力。
可选地,所述客观评测模式包括:韵律评测模式、数字符号评测模式、多音字评测模式和分词词性评测模式。
通过各个方面对语音合成系统进行测评,能够全面地反映该语音合成系统存在的问题,从而使得测评结果更加准确和全面。
可选地,该方法还包括主观评测步骤,所述主观评测步骤包括:
第四数据接收步骤:接收用户上传的第四数据,其中,所述第四数据是将至少一个测试集输入到待评测的语音合成系统后输出的第一语音合成结果;
主观评测结果生成步骤:接收用户对至少一个主观评测模式的选择并将选择的结果发送给评测人员,接收所述评测人员基于所述用户选择的主观评测模式对所述第四数据进行评测得到的主观评测结果;和
主观评测结果输出步骤:将所述主观评测结果输出给所述用户。
该方法将客观评测和主观评测相结合,能够对语音合成系统进行多个角度的全方位评测,通过主观评测弥补客观评测的不足,能够检测出语音中更细微的缺陷或者杂音变声等通过计算机无法很好识别的问题,从而使得评测结果更加准确。
可选地,所述主观评测模式包括:语音质量对比评测模式和语音质量评分评测模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于标贝(北京)科技有限公司,未经标贝(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810179637.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频信号相似度检测方法
- 下一篇:基于参数迁移和语谱图的语音情感识别方法