[发明专利]基于卷积神经网络的光学乐谱识别方法有效
申请号: | 201910787063.9 | 申请日: | 2019-08-25 |
公开(公告)号: | CN110598581B | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 马学健;董瓒;郭玲 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/148;G06V30/18;G06N3/04;G06T7/00;G06T7/70 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 陈鹏 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于卷积神经网络的光学乐谱识别方法,包括:对乐谱图像进行谱线检测;根据谱线的位置进行谱线删除;音符分割,得到一系列音符图像;将音符图像输入到已经训练好的神经网络中完成识别。本发明采用基于图论的谱线检测算法进行谱线检测,不受乐谱图像的质量、谱线扭曲形变等影响,可以准确检测出谱线的位置;采用基于线轨迹高度+局部游程直方图算法进行谱线删除,可以有效避免过删除现象;采用基于层次分级+模板匹配的分割算法,可以有效进行音符分割且保证音符的完整性;利用卷积神经网络对分割之后音符进行识别,结果具有较好的识别精度和识别速率。 | ||
搜索关键词: | 基于 卷积 神经网络 光学 乐谱 识别 方法 | ||
【主权项】:
1.一种基于卷积神经网络的光学乐谱识别方法,其特征在于,包括以下步骤:/n步骤1、利用图论的稳定路径方法进行谱线检测,获得谱线的位置,即一系列像素点坐标;/n步骤2、根据谱线的位置,利用线轨迹高度+局部游程直方图算法进行谱线删除;/n步骤3、利用层次分解+模板匹配方法对图像进行分割,获得一系列独立的音符;/n步骤4、将分割出来的音符输入到一个已经训练好的神经网络,得到音符类型;如果识别音符中含有符头,则根据谱线位置判定其符头的音高;/n步骤5、对步骤4中识别的音符类型进行乐谱语义重构,并将结果转化为通用的数字音乐格式。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910787063.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种人脸活体检测方法
- 下一篇:一种眼图像处理模型构建方法和装置