[发明专利]一种基于参数配置的听力音频制作方法、系统及装置在审
申请号: | 202310254417.X | 申请日: | 2023-03-16 |
公开(公告)号: | CN116386588A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 张晓益 | 申请(专利权)人: | 南京思维构造数字技术有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G06F40/205;G06F40/279 |
代理公司: | 南京苏创专利代理事务所(普通合伙) 32273 | 代理人: | 石嘉蓉 |
地址: | 210000 江苏省南京市秦淮*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 参数 配置 听力 音频 制作方法 系统 装置 | ||
1.一种基于参数配置的听力音频制作方法,其特征在于,包括以下步骤:
以听力试题原文作为输入,并对听力试题原文的逻辑结构进行划分,所述逻辑结构的划分包括章节的划分以及试题/提示文本的划分;
基于听力试题原文的逻辑结构,将听力试题原文组织为各个章节,并将各个章节中的文本组织为“考试提示”和“试题”两类;
基于听力试题原文的章节结构,进行各类参数的配置,其中第一类参数包括“考试提示”文本的播音方式和停顿时间,第二类参数包括“试题”文本的播音方式和停顿时间,第三类参数包括各章节内试题的重复次数Cx;
针对“考试提示”文本,根据第一类参数以段落为单位生成音频或音频处理指令;针对“试题”文本,以段落为单位进行题号和对话角色的识别,同时根据第二类和第三类参数生成音频或音频处理指令;当所有章节均处理完后,将所有生成的音频或音频处理指令按照文本顺序进行挂接,生成完整的音频或音频处理指令返回。
2.根据权利要求1所述的听力音频制作方法,其特征在于,进行参数配置时,将配置好的参数保存于后台,用于实现重复使用。
3.根据权利要求2所述的听力音频制作方法,其特征在于,后台所保存的配置以对应的听力类别进行标注,这样进行参数配置时,将自动识别“考试提示”文本中的听力类别,并在后台提取匹配的配置,如果提取成功则将其返回给用户进行选择和修改,否则返回默认配置给用户进行选择和修改。
4.根据权利要求1所述的听力音频制作方法,其特征在于,所述“考试提示”文本的停顿时间包括各段落之间的停顿时间H1和文本整体结尾的停顿时间H2;所述“试题”文本的停顿时间包括题号后的停顿时间Q1、对话间的停顿时间Q2和各段落之间的停顿时间Q3;所述第三类参数还包括各章节内试题开始前的提示音LSx、试题重复时的提示音LBx、试题重复时的停顿时间Tx和试题结束后的停顿时间Gx。
5.根据权利要求1所述的听力音频制作方法,其特征在于,在根据“考试提示”和“试题”文本生成音频或音频处理指令时,先以段落为单位提取各类参数,并优先按照提取的参数生成音频或音频处理指令,如果提取不成功则按照配置的参数生成音频或音频处理指令。
6.一种基于参数配置的听力音频制作系统,其特征在于,包括以下模块:
总控模块,用于输入听力试题原文,并对听力试题原文的逻辑结构进行划分,所述逻辑结构的划分包括章节的划分以及试题/提示文本的划分;
章节管理模块,用于根据听力试题原文的逻辑结构,将听力试题原文组织为各个章节,并将各个章节中的文本组织为“考试提示”和“试题”两类;
配置管理模块,用于基于听力试题原文的章节结构,进行各类参数的配置,其中第一类参数包括“考试提示”文本的播音方式和停顿时间,第二类参数包括“试题”文本的播音方式和停顿时间,第三类参数包括各章节内试题的重复次数Cx;
章节处理模块,包括考试提示处理子模块和试题处理子模块,其中针对“考试提示”文本,考试提示处理子模块根据第一类参数以段落为单位生成音频处理指令;针对“试题”文本,试题处理子模块以段落为单位进行题号和对话角色的识别,同时根据第二类和第三类参数生成音频处理指令;
音频生成模块,用于记录章节处理模块生成的音频处理指令,按照文本顺序进行挂接,并利用文字转语音技术进行处理,生成完整的听力音频。
7.根据权利要求6所述的听力音频制作系统,其特征在于,所述配置管理模块包括配置选择模块和配置库,其中配置好的参数以对应的听力类别进行标注并保存于配置库中,这样进行参数配置时,配置选择模块将自动识别“考试提示”文本中的听力类别,并在配置库内提取匹配的配置,如果提取成功则将其返回给用户进行选择和修改,否则返回默认配置给用户进行选择和修改。
8.根据权利要求6所述的听力音频制作系统,其特征在于,所述考试提示处理子模块和试题处理子模块在生成音频处理指令时,先以段落为单位提取各类参数,并优先按照提取的参数生成音频处理指令,如果提取不成功则按照配置的参数生成音频处理指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京思维构造数字技术有限公司,未经南京思维构造数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310254417.X/1.html,转载请声明来源钻瓜专利网。