[发明专利]基于音乐搜索引擎的多层查询纠正方法及系统在审
申请号: | 201710757048.0 | 申请日: | 2017-08-29 |
公开(公告)号: | CN107729351A | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 陈君炫;朱映波;吴三阳;曾荣;王伟;潘志锋 | 申请(专利权)人: | 天翼爱音乐文化科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州知顺知识产权代理事务所(普通合伙)44401 | 代理人: | 彭志坚 |
地址: | 510000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于音乐搜索引擎的多层查询纠正方法,在基于用户查询词在音乐搜索引擎中没有任何返回结果的前提下,对用户的查询词进行查询纠正;本发明提出多层查询纠正算法对用户查询词进行纠正,包括将用户查询词转换成拼音进行同音词查询以及利用编辑距离算法找到与用户查询词相似的索引项,纠正后返回的多个结果作为纠正查询的候选集;采用合适的候选集筛选方法,包括热度筛选方法、文档频率筛选方法以及最长公共子串长度筛选方法,在候选集中选择最优的纠正查询替代用户查询词。本发明能够准确地纠正搜索引擎中用户的错误查询,提高搜索结果的质量。 | ||
搜索关键词: | 基于 音乐 搜索引擎 多层 查询 纠正 方法 系统 | ||
【主权项】:
一种基于音乐搜索引擎的多层查询纠正方法,其特征在于,包括:S1、当基于用户查询词进行音乐搜索,无结果返回时,判断用户查询词是否为中文,如果是执行步骤S2,否则执行步骤S4;S2、将用户查询词转换成拼音,然后查询歌曲要素文档的全拼及简拼字段的索引项,得到所需的歌曲要素文档;其中,歌曲要素文档包括:歌曲要素字段、歌曲要素全拼字段、歌曲要素简拼字段、歌曲要素类型字段以及歌曲要素热度字段;S3、将查询得到的歌曲要素文档按照热度进行排序,返回热度最高的文档的歌曲要素字段为最优纠正查询;S4、在歌曲文档的歌曲名字段以及歌手名字段的索引项中找出与用户查询词的文本编辑距离为第一阈值的索引项;其中,所述歌曲文档包括歌曲名、歌手名、专辑名、歌词以及歌曲名与歌手名的组合字段;S5、判断是否有匹配的索引项,如果有执行步骤S6,否则执行步骤S7;S6、将返回的匹配索引项作为纠正查询的候选集,在候选集中选择文档频率最高的歌曲要素字段为最优纠正查询;其中,所述索引项的文档频率是指包含该索引项的文档数量;S7、在歌曲文档的组合字段的索引项中找出与用户查询词的文本编辑距离为第二阈值的组合索引项;S8、判断是否有匹配的组合索引项,如果有执行步骤S9,否则执行步骤S10;S9、将返回的匹配组合索引项作为纠正查询候选集,在候选集中选择最长公共子串最大的索引项为最优纠正查询;其中,所述最长公共子串是指在两个序列中同时出现的最长子序列的长度;S10、返回没有纠正查询的提示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼爱音乐文化科技有限公司,未经天翼爱音乐文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710757048.0/,转载请声明来源钻瓜专利网。