[发明专利]构建乐谱库的方法和装置在审
申请号: | 201611243896.1 | 申请日: | 2016-12-29 |
公开(公告)号: | CN106649811A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 刘卓 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司11138 | 代理人: | 郭晶 |
地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 乐谱 方法 装置 | ||
技术领域
本发明涉及网络通信技术领域,特别涉及一种构建乐谱库的方法和装置。
背景技术
随着网络通信技术的发展,多媒体服务器的功能越来越强大;多媒体服务器向终端从发送歌曲时,不仅可以向终端发送歌曲,还能够向终端发送歌曲的乐谱,以使终端在播放歌曲的同时,在当前播放界面上显示歌曲的乐谱。因此,多媒体服务器向终端发送歌曲的乐谱之前,需要构建乐谱库。
目前,多媒体服务器在构建乐谱库时,多媒体服务器先获取提供乐谱的目标网站的网址,根据该目标网站的网址,从目标网站中爬取包含乐谱的图像。该图像中往往包含该乐谱的歌曲的名称;然后人工从该图像中识别出该乐谱的歌曲的名称。多媒体服务器将该歌曲的名称和包含该乐谱的图像对应关系添加到乐谱库中。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
由于目标网站中包含乐谱的图像往往为用户上传的,该图像中可能包含错误的乐谱,从而导致多媒体服务器构建乐谱库中包含错误的乐谱,也即上述方法构建乐谱库的准确性差。
发明内容
为了解决现有技术的问题,本发明提供了一种构建乐谱库的方法和装置。技术方案如下:
第一方面,本发明实施例提供了一种构建乐谱库的方法,所述方法包括:
从目标网站中爬取乐谱,以及,从所述目标网站中爬取所述乐谱对应的多媒体文件的标识;
根据所述多媒体文件的标识,获取所述多媒体文件;
根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配;
如果所述乐谱与所述多媒体文件匹配,将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。
可选的,所述根据所述乐谱和所述多媒体文件,验证所述乐谱与所述多媒体文件是否匹配,包括:
根据所述乐谱和所述多媒体文件,通过预设相似度算法,确定所述乐谱和所述多媒体文件之间的相似度;
如果所述相似度超过预设阈值,确定所述乐谱与所述多媒体文件匹配。
可选的,所述根据所述乐谱和所述多媒体文件,通过预设相似度算法,确定所述乐谱和所述多媒体文件之间的相似度之前,所述方法还包括:
获取预设数目个样本乐谱、每个样本乐谱对应的多媒体文件,以及,所述每个样本乐谱和每个多媒体文件之间的相似度;
根据所述每个样本乐谱、所述每个样本乐谱对应的多媒体文件,以及,所述每个样本乐谱和每个多媒体文件之间的相似度,通过迭代算法,对所述预设相似度算法进行优化。
可选的,所述将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中之前,所述方法还包括:
将指定标注信息添加到所述乐谱中,所述指定标注信息用于标注多媒体服务器。
可选的,所述将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中之后,所述方法还包括:
接收终端发送的反馈信息,所述反馈信息中包括所述乐谱中待校正的音符标识和校正后的音符;
根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符。
可选的,所述根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符之前,所述方法还包括:
统计接收所述反馈信息的接收次数;
如果所述接收次数超过预设次数,执行所述根据所述音符标识,将所述乐谱中待校正的音符修改为所述校正后的音符的步骤。
可选的,所述从目标网站中爬取乐谱,包括:
获取所述目标网站的标识,根据所述目标网站的标识,获取所述目标网站中乐谱所在的位置信息;
根据所述目标网站的标识和所述位置信息,在所述目标网站中确定所述位置信息对应的爬取区域;
从所述爬取区域中爬取所述乐谱。
可选的,所述从所述爬取区域中爬取所述乐谱,包括:
从所述爬取区域中爬取包含所述乐谱的图像;
从所述图像中识别出所述乐谱的音符序列和节拍标识,将所述音符序列和所述节拍标识组成所述乐谱。
可选的,所述从所述目标网站中爬取所述乐谱对应的多媒体文件的标识,包括:
从所述目标网站中爬取文字信息,从所述文字信息中提取所述乐谱对应的多媒体文件的标识。
可选的,如果从所述目标网站中没有爬取到所述多媒体文件的标识,所述方法还包括:
根据所述乐谱,从多媒体文件库中选择与所述乐谱匹配的多媒体文件;
将所述乐谱和选择的多媒体文件的标识的对应关系添加到乐谱库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611243896.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于Ajax的新闻网页动态数据的抓取方法及系统
- 下一篇:茶几(61895)