[发明专利]面向智能节目制作的训练数据生成方法及装置有效
申请号: | 201811251494.5 | 申请日: | 2018-10-25 |
公开(公告)号: | CN111105817B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 薛子育;郭沛宇;王磊 | 申请(专利权)人: | 国家广播电视总局广播电视科学研究院 |
主分类号: | G11B27/031 | 分类号: | G11B27/031;G11B27/34 |
代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 闫雪薇;马佑平 |
地址: | 100866 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 智能 节目 制作 训练 数据 生成 方法 装置 | ||
1.一种面向智能节目制作的训练数据集生成方法,其特征在于,所述方法包括:
根据节目内容,获取节目内容片段;
根据节目编目信息,获取节目语义片段;
从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息;
按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集;
输出所述训练数据集;
其中,所述按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集的步骤,包括:
将所述节目编目信息、所述节目语义片段以及所述素材编目信息按照JSON语法格式进行拼接,生成训练数据描述信息;
将所述节目内容、所述节目内容片段以及所述素材依次封装,生成训练数据;
根据所述训练数据描述信息和所述训练数据生成所述训练数据集。
2.根据权利要求1所述的方法,其特征在于,所述根据节目内容,获取节目内容片段的步骤,包括:
将所述节目内容按照节目镜头进行分割,获取所述节目内容片段。
3.根据权利要求1所述的方法,其特征在于,所述根据节目编目信息,获取节目语义片段的步骤,包括:
将所述节目编目信息按照语义进行分割,获取所述节目语义片段。
4.根据权利要求1所述的方法,其特征在于,所述从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息的步骤,包括:
向所述媒资库发送检索请求,所述检索请求中包含所述节目内容片段;
接收来自所述媒资库的与所述节目内容片段匹配的素材以及与所述素材对应的素材编目信息。
5.一种面向智能节目制作的训练数据集生成装置,其特征在于,所述装置包括:
节目内容分割模块,用于根据节目内容,获取节目内容片段;
编目信息语义分割模块,用于根据节目编目信息,获取节目语义片段;
素材检索模块,用于从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息;
训练数据封装模块,用于按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集;
输出模块,用于输出所述训练数据集;
其中,所述训练数据封装模块具体用于:
将所述节目编目信息、所述节目语义片段以及所述素材编目信息按照JSON语法格式进行拼接,生成训练数据描述信息;
将所述节目内容、所述节目内容片段以及所述素材依次封装,生成训练数据;
根据所述训练数据描述信息和所述训练数据生成所述训练数据集。
6.根据权利要求5所述的装置,其特征在于,所述节目内容分割模块具体用于:
将所述节目内容按照节目镜头进行分割,获取所述节目内容片段。
7.根据权利要求5所述的装置,其特征在于,所述编目信息语义分割模块具体用于:
将所述节目编目信息按照语义进行分割,获取所述节目语义片段。
8.根据权利要求5所述的装置,其特征在于,所述素材检索模块具体用于:
向所述媒资库发送检索请求,所述检索请求中包含所述节目内容片段;
接收来自所述媒资库的与所述节目内容片段匹配的素材以及与所述素材对应的素材编目信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家广播电视总局广播电视科学研究院,未经国家广播电视总局广播电视科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811251494.5/1.html,转载请声明来源钻瓜专利网。