[发明专利]一种人工机器结合的音频分类方法在审
申请号: | 201911249674.4 | 申请日: | 2019-12-09 |
公开(公告)号: | CN111125421A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 杜春河;丁宁 | 申请(专利权)人: | 广州荔支网络技术有限公司 |
主分类号: | G06F16/65 | 分类号: | G06F16/65 |
代理公司: | 中山奇昱专利代理事务所(普通合伙) 44557 | 代理人: | 黄国清 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人工 机器 结合 音频 分类 方法 | ||
本发明公开了一种人工机器结合的音频分类方法,包括:建立节目库,对节目库中的节目进行人工分类;从待分类节目中读取节目信息;查找节目库已分类节目中是否有与待分类节目内容相同的节目;若节目库已分类节目中有与待分类节目内容相同的节目,则将待分类节目分类为与已分类节目同样的分类。提高分类效率、节约成本。
技术领域
本发明涉及一种人工机器结合的音频分类方法。
背景技术
音频在内容丰富,可能是文学、科技、娱乐等各种各样的类别;消费音频的用户的兴趣点千差万别;如何从海量的音频库中抽取出用户感兴趣的内容,对音频的生产者和消费者都至关重要。一种常见的处理是给用户推荐他感兴趣的内容相关的音频节目。例如,用户对历史感兴趣,就给他推荐《明朝那些事》相关的音频节目。传统的多用人工处理的方式给音频分类,虽然准确率高,但是这种方式有如下缺点:(1)效率低:每条音频都需要人工进行仔细的审核,给出分类信息;(2)重复工作:互联网上的音频,有着内容重复的现象,音频A、B是《西游记》的同一段有声小说,A、B都需要人工进行审核,本质上是做了重复工作。(3)成本高昂。
发明内容
本发明旨在至少在一定程度上解决现有相关技术中存在的问题之一,为此,本发明的目的在于提出一种人工机器结合的音频分类方法,提高分类效率。
上述目的是通过如下技术方案来实现的:
一种人工机器结合的音频分类方法,包括:
建立节目库,对节目库中的节目进行人工分类;
从待分类节目中读取节目信息;
查找节目库已分类节目中是否有与待分类节目内容相同的节目;
若节目库已分类节目中有与待分类节目内容相同的节目,则将待分类节目分类为与已分类节目同样的分类。
作为本发明的进一步改进,所述建立节目库包括:收集节目;判断收集的节目是否为音频节目;若收集的节目为音频节目,则将音频信息转为文本信息;对节目库中的节目进行人工分类。
作为本发明的进一步改进,所述收集节目包括收集音频节目和文本节目。
作为本发明的进一步改进,从待分类节目中读取节目信息的步骤具体为:判断待分类节目是否为音频节目;若待分类节目为音频节目,则将音频信息转为文本信息。
作为本发明的进一步改进,查找节目库已分类节目中是否有与待分类节目内容相同的节目的步骤具体为:若已分类节目中没有与待分类节目内容相同的节目,则将待分类节目进行人工分类;若已分类节目中有与待分类节目内容相同的节目,则将待分类节目分类为与已分类节目同样的分类。
作为本发明的进一步改进,通过simhash方法查找节目库已分类节目中是否有与待分类节目内容相同的节目。
作为本发明的进一步改进,将待分类节目分类后,将分类信息补入到节目库中。
与现有技术相比,本发明的至少包括以下有益效果:
1.本发明提出一种人工机器结合的音频分类方法,通过人工与机器结合的方法对音频进行分类,提高工作效率,避免重复工作。
附图说明
图1是本发明一种人工机器结合的音频分类方法的流程图。
具体实施方式
以下实施例对本发明进行说明,但本发明并不受这些实施例所限制。对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换,而不脱离本发明方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州荔支网络技术有限公司,未经广州荔支网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911249674.4/2.html,转载请声明来源钻瓜专利网。