[发明专利]基于声纹识别的电视节目单校对方法和装置在审
申请号: | 202110609022.8 | 申请日: | 2021-06-01 |
公开(公告)号: | CN113347473A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 范洪涛 | 申请(专利权)人: | 广州欢网科技有限责任公司 |
主分类号: | H04N21/262 | 分类号: | H04N21/262;H04N21/488;G10L17/00;G10L17/04 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 牛晴 |
地址: | 510000 广东省广州市番禺*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 声纹 识别 电视 节目单 校对 方法 装置 | ||
1.一种基于声纹识别的电视节目单校对方法,其特征在于,包括:
获取待处理电视节目单;
确定所述待处理电视节目单中各电视节目的预设播放时间;
在当前节目的播放过程中,录制所述当前节目的指定时间段的声音片段;所述当前节目的指定时间段的声音片段包含所述当前节目的实际播放时间;
判断预设声纹样本特征库中是否存储有与所述当前节目的指定时间段的声音片段对应的目标声音片段;若是,根据所述当前节目的指定时间段的声音片段和预设声纹样本特征库校正所述待处理电视节目单中所述当前节目的预设播放时间;
否则,自动报警。
2.根据权利要求1所述的基于声纹识别的电视节目单校对方法,其特征在于,所述自动报警之后,还包括:
保存所述当前节目的指定时间段的声音片段;
根据用户的完善操作,基于所述当前节目的指定时间段的声音片段完善所述预设声纹样本特征库。
3.根据权利要求1所述的基于声纹识别的电视节目单校对方法,其特征在于,所述判断预设声纹样本特征库中是否存储有与所述当前节目的指定时间段的声音片段对应的目标声音片段之前,还包括:
建立预设声纹样本特征库;所述预设声纹样本特征库包含各所述电视节目的指定时间段的声音片段。
4.根据权利要求3所述的基于声纹识别的电视节目单校对方法,其特征在于,所述建立预设声纹样本特征库,包括:
录制各所述电视节目的指定时间段的声音片段;
对各所述电视节目的指定时间段的声音片段进行提取MFCC特征参数处理,得到预处理声音片段;
根据用户的标记操作分别标记各所述预处理声音片段对应的电视节目,得到标记后的预处理声音片段;
基于深度学习对各所述标记后的预处理声音片段进行声纹特征训练,得到所述预设声纹样本特征库。
5.根据权利要求1所述的基于声纹识别的电视节目单校对方法,其特征在于,所述自动报警之后,还包括:
根据用户的校正操作校正所述待处理电视节目单中所述当前节目的预设播放时间。
6.根据权利要求1所述的基于声纹识别的电视节目单校对方法,其特征在于,所述指定时间段为电视节目片头3分钟。
7.一种基于声纹识别的电视节目单校对装置,其特征在于,包括:
获取模块,用于获取待处理电视节目单;
确定模块,用于确定所述待处理电视节目单中各电视节目的预设播放时间;
录制模块,用于在当前节目的播放过程中,录制所述当前节目的指定时间段的声音片段;所述当前节目的指定时间段的声音片段包含所述当前节目的实际播放时间;
判断模块,用于判断预设声纹样本特征库中是否存储有与所述当前节目的指定时间段的声音片段对应的目标声音片段;
校正模块,用于当判断模块判断出预设声纹样本特征库中存储有与所述当前节目的指定时间段的声音片段对应的目标声音片段时,根据所述当前节目的指定时间段的声音片段和预设声纹样本特征库校正所述待处理电视节目单中所述当前节目的预设播放时间;
报警模块,用于当判断模块判断出预设声纹样本特征库中未存储有与所述当前节目的指定时间段的声音片段对应的目标声音片段时,自动报警。
8.根据权利要求7所述的基于声纹识别的电视节目单校对装置,其特征在于,还包括:完善模块;
所述完善模块用于保存所述当前节目的指定时间段的声音片段,以及用于根据用户的完善操作,基于所述当前节目的指定时间段的声音片段完善所述预设声纹样本特征库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州欢网科技有限责任公司,未经广州欢网科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110609022.8/1.html,转载请声明来源钻瓜专利网。