[发明专利]一种诗词吟诵风格的分类方法与系统有效

申请号：	201911057959.8	申请日：	2019-11-01
公开（公告）号：	CN110782917B	公开（公告）日：	2022-07-12
发明（设计）人：	吴蔚;常映明;陈仲华;郭晓文;柳锦华	申请（专利权）人：	广州美读信息技术有限公司
主分类号：	G10L25/30	分类号：	G10L25/30;G10L25/51;G10L25/63;G10L25/24
代理公司：	广州新诺专利商标事务所有限公司 44100	代理人：	李海恬
地址：	510623 广东省广州***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及语音信号处理及分类技术，为诗词吟诵风格的分类方法与系统，其方法包括：准备诗词朗诵的原始音频，获取每一个字及每一句的起始时间标注，得到相应的起始时间标注数据，获取原始音频的评分数据、风格标注数据；提取原始音频的音频特征序列，对诗词句子进行切分，将音频特征序列形成多通道的二维数组；将二维数组及评分数据作为CNN神经网络的输入，对其进行训练得到权重；改变CNN神经网络的全连接层参数，将得到的训练结果作为风格分类网络；应用风格分类网络对古诗词吟诵音频进行吟诵风格分类。本发明能快速、客观识别出音频数据的吟诵风格，方便对吟诵者的吟诵风格进行分类及评价。
搜索关键词：	一种诗词吟诵风格分类方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种诗词吟诵风格的分类方法，其特征在于，包括以下步骤：/nS1、数据准备，记录诗词朗诵的原始音频；对原始音频进行时间标注，获取原始音频每一个字以及每一句的起始时间标注，得到相应的起始时间标注数据；获取原始音频的评分数据；随机抽取一部分原始音频进行风格标注，形成风格标注数据；/nS2、提取原始音频的音频特征序列；对诗词的句子进行切分，将所提取的音频特征序列形成多通道的二维数组；将多通道的二维数组以及原始音频的评分数据作为CNN神经网络的输入，对CNN神经网络进行训练，得到CNN神经网络的权重；/nS3、训练风格分类网络，改变CNN神经网络的全连接层参数，将具有新的全连接层参数的CNN神经网络为最终训练的结果，作为风格分类网络；/nS4、应用训练好的风格分类网络，对古诗词吟诵音频进行吟诵风格分类。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州美读信息技术有限公司，未经广州美读信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201911057959.8/，转载请声明来源钻瓜专利网。

上一篇：一种多模态的投诉识别方法、装置和系统
下一篇：一种基于人工智能的语音韵律评估方法及装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种诗词吟诵风格的分类方法与系统有效

专利文献下载