[发明专利]一种基于参数配置的听力音频制作方法、系统及装置在审
申请号: | 202310254417.X | 申请日: | 2023-03-16 |
公开(公告)号: | CN116386588A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 张晓益 | 申请(专利权)人: | 南京思维构造数字技术有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G06F40/205;G06F40/279 |
代理公司: | 南京苏创专利代理事务所(普通合伙) 32273 | 代理人: | 石嘉蓉 |
地址: | 210000 江苏省南京市秦淮*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 参数 配置 听力 音频 制作方法 系统 装置 | ||
本发明公开了一种基于参数配置的听力音频制作方法、系统及装置,该方法包括:以听力试题原文作为输入,并对听力试题原文的逻辑结构进行划分;基于听力试题原文的逻辑结构,将听力试题原文组织为各个章节,并将各个章节中的文本组织为“考试提示”和“试题”两类;基于听力试题原文的章节结构进行各类参数的配置,并按照配置好的参数自动生成音频或音频处理指令;当所有章节处理完后,按照文本顺序进行挂接,生成完整的音频或音频处理指令返回。使用者仅需对听力试题原文的逻辑结构进行划分,并设置每种类型文本的制作参数,而不用像现有技术那样需要去为每句话设置相应指令,除了工作量明显降低以外,有效降低了使用者的学习门槛。
技术领域
本发明涉及一种基于参数配置的听力音频制作方法、系统及装置,属于信息处理技术领域。
背景技术
当前文字转语音(Text-to-Speech)技术已经成熟,广泛应用于生活、工作、学习等方方面面。而针对各类听力考试,譬如英语听力考试的音频,由于听力考试中大量出现对话等内容,如果采用传统的人工录音方式,则至少需要男女教师各一名,通过朗读试题内容进行录音,这就对制作条件和制作成本都有较高要求。因此,针对英语听力考试音频的制作正由人工录音制作方式快速演变为使用“文字转语音”技术去生成,这大大节省了人力,也保证了制作质量的稳定性。
目前使用“文字转语音”技术去生成英语听力考试音频时,现有技术需要指定每段文字所使用的AI播音员及其语速,每道试题结束后需要插入停顿时间,用于学生答题,而在制作不同年级的听力考试音频时,其语速均不一样,低年级听力考试的语速需要较慢,以便降低难度,同时留给学生答题的停顿时间也需要更长。
因此,即便“文字转语音”技术的应用总体上降低了制作门槛,但依然需要大量的制作工作量,不同年级的听力考试具有不同的难度,其不仅体现在试题本身上,还体现在播音员语速、答题停顿时间等与听力制作相关联的多种条件上,这使得听力制作时需要考虑多种参数的调节,这也增加了听力制作的复杂性。
发明内容
发明目的:针对现有技术所存在的问题,本发明提供一种基于参数配置的听力音频制作方法、系统及装置,基于听力试题原文的逻辑结构划分,使得听力音频的制作参数体现出一定的规律性,从而抽象出相应的配置,大大简化听力音频的制作过程,提升其制作效率,降低其制作门槛。
技术方案:为实现上述目的,本发明提供了一种基于参数配置的听力音频制作方法,包括以下步骤:
以听力试题原文作为输入,并对听力试题原文的逻辑结构进行划分,所述逻辑结构的划分包括章节的划分以及试题/提示文本的划分;
基于听力试题原文的逻辑结构,将听力试题原文组织为各个章节,并将各个章节中的文本组织为“考试提示”和“试题”两类;
基于听力试题原文的章节结构,进行各类参数的配置,其中第一类参数包括“考试提示”文本的播音方式和停顿时间,第二类参数包括“试题”文本的播音方式和停顿时间,第三类参数包括各章节内试题的重复次数Cx,其中停顿时间以静音的形式作为单独的音频或音频处理指令进行处理;
针对“考试提示”文本,根据第一类参数以段落为单位生成音频或音频处理指令;针对“试题”文本,以段落为单位进行题号和对话角色的识别,同时根据第二类参数生成音频或音频处理指令;当所有章节均处理完后,将所有生成的音频或音频处理指令按照文本顺序进行挂接,生成完整的音频或音频处理指令返回。
进一步的,进行参数配置时,将配置好的参数保存于后台,用于实现重复使用。
进一步的,后台所保存的配置以对应的听力类别进行标注,这样进行参数配置时,将自动识别“考试提示”文本中的听力类别,并在后台提取匹配的配置,如果提取成功则将其返回给用户进行选择和修改,否则返回默认配置给用户进行选择和修改。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京思维构造数字技术有限公司,未经南京思维构造数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310254417.X/2.html,转载请声明来源钻瓜专利网。