[发明专利]一种乐谱识别方法有效
申请号: | 201310445379.2 | 申请日: | 2013-09-26 |
公开(公告)号: | CN103646247B | 公开(公告)日: | 2016-11-23 |
发明(设计)人: | 蔡昭权;陈力豪;黄翰 | 申请(专利权)人: | 惠州学院 |
主分类号: | G06K9/54 | 分类号: | G06K9/54 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 张晓霞 |
地址: | 516007 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 乐谱 识别 方法 | ||
1.一种乐谱识别方法,其特征在于,包括:
a.输入乐谱图像,获得所述乐谱图像的二值图像;
b.使用交叉相关函数对所述二值图像的各区域进行水平修正,获得水平图像;
c.对所述水平图像进行谱线定位,并删除所述谱线,获得删除谱线的图像;
d.在所述删除谱线的图像中定位符干,获得符干基元的坐标数据,及删除符干的图像;
e.在所述删除符干的图像中定位尾桥,获得尾桥基元的坐标数据,及删除尾桥的图像;
f.在所述删除尾桥的图像中定位符头,得到符头基元的坐标数据;
g.将基元符干、尾桥、符头的数据进行匹配,并整合声部数、时值以及声高,生成musicXML文件。
2.根据权利要求1所述的乐谱识别方法,其特征在于,所述步骤a具体包括:
a1.扫描乐谱得到乐谱图像;
a2.对所述乐谱图像进行二值化、图像增强和平滑滤波处理,获得二值图像。
3.根据权利要求1所述的乐谱识别方法,其特征在于,所述步骤b具体包括:
利用交叉相关函数对所述二值图像进行水平修正,获得水平图像;
其中,交叉相关函数为g(x,y)表示所述二值图像上横坐标为x,纵坐标为y的某一个像素点A,g(x+d,y+μ)表示所述二值图像上横坐标为x+d,纵坐标为y+μ的另一个像素点B,d表示A和B之间的水平距离,μ表示A和B之间的垂直距离,C(x,μ)表示A与B之间的相关性;0≤x≤W,0≤y≤H,W表示所述二值图像的宽度,H表示所述二值图像的高度。
4.根据权利要求1所述的乐谱识别方法,其特征在于,所述步骤c具体包括:
c1.对所述水平图像进行水平投影,统计不同高度上水平投影队列黑色像素的个数得到水平投影数组,所述水平投影数组中峰值所在的位置即为谱线位置;
c2.对谱线所在位置黑色像素的上下两端的像素进行判断,如果两边的像素都为白色,且该黑色像素的高度小于或者等于谱线预期的高度,则将该黑色像素改为白色,获得删除谱线的图像。
5.根据权利要求1所述的乐谱识别方法,其特征在于,所述步骤d具体包括:
d1.对所述删除谱线的图像进行高斯模糊处理后,对其进行骨架化操作;
d2.创建数组VLTemp[]用于保存所述删除谱线的图像中的竖直线的上端点的纵坐标,VLTemp[i]表示横坐标为x=i的竖直线的上端点的纵坐标;并初始化VLTemp[i]=-1(i=0,……,W-1);
对于i所对应的竖直线:
按照纵坐标从大到小的顺序,检测所述竖直线上每个像素点及其左右两侧像素点的颜色,若该像素点颜色为黑色,其左右两侧像素点颜色为白色,用0表示白色像素,1表示黑色像素,即像素排列形如“010”模式,且VLTemp[i]为-1时,将VLTemp[i]改为当前遍历中的纵坐标y1,若当前遍历坐标不满足“010”模式,VLTemp[i]又不为-1时,判断当前遍历纵坐标和VLTemp[i]之间的差值,若差值大于长度阀值t1,t1为两个像素,则当前遍历纵坐标即为所述竖直线的下端点纵坐标y2;
将所述竖直线的上端点纵坐标y1,下端点纵坐标y2,横坐标x保存到链表C1中,重新给VLTemp[i]赋初值-1;
d3.对所述链表C1进行两次排序,第一次按所述竖直线的横坐标x排序,第二次按所述竖直线的纵坐标y2排序,并以数组vSet记录每一行第一条竖直线的位置坐标;
d4.遍历所述链表C1中竖直线的横坐标,并判断竖直线的横坐标x的差值,若出现两条竖直线的横坐标x的差值小于阀值t2,t2为两个像素,则判断所述两条竖直线的纵坐标,若所述两条竖直线其中一条的上端点纵坐标y1和另外一条的下端点纵坐标y2的差值也小于阀值t2,此时将所述两条竖直线判定为被截断的竖直线,所述两条被截断的竖直线的合并公式为:
当删除所述两条被截断的竖直线中纵坐标较大的竖直线的情况时:
当删除所述两条被截断的竖直线中纵坐标较小的竖直线的情况时:
其中,表示所述两条被截断的竖直线中纵坐标较小的那条竖直线的上端点、下端点纵坐标,表示所述两条被截断的竖直线中纵坐标较大的那条竖直线的上端点、下端点纵坐标;
重新设置记录每一行第一条垂线的数组vSet;
d5.将所述链表C1中所记录的竖直线的上下端点的纵坐标之差超过1.5*4*λ的竖直线删除,其中λ为谱线间距;
d6.将所述链表C1中存放的坐标所对应的符干改为白色像素,得到删除符干的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠州学院,未经惠州学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310445379.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:注射泵快速阻塞检测系统
- 下一篇:双灌流器并联序贯装置