[发明专利]使用解说词文档自动生成营养健康教育视频的方法及系统有效

申请号：	201310291597.5	申请日：	2013-07-11
公开（公告）号：	CN103324760A	公开（公告）日：	2013-09-25
发明（设计）人：	杨颖;陈瑛;高万林	申请（专利权）人：	中国农业大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	王莹
地址：	100193 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	使用解说词文档自动生成营养健康教育视频方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及多媒体技术领域，特别涉及一种使用解说词文档自动提取关键词并搜索相关图片生成营养健康教育视频的方法及系统。

背景技术

根据解说词全自动生成视频的方法和系统是根据文本中相对应的词，主要是名词进行网络或/和本地的相关图片搜索，但是汉语本身的语言特性决定了其词性的复杂性，从而导致词性的划分不准确，所寻找到的图片也不准确，因此对于根据解说词全自动生成视频的方法和系统的研究也少有涉及。经研究表明，在营养健康教育领域，语句的复杂度较低，词性相对确定，具备了机器自动识别词性，自动寻找关键词及获取相关图片，自动生成多媒体视频的先决条件。

营养健康教育多媒体视频的编制需要经过选材、编辑和制作等过程，其中选材过程是其中工作量最大，最耗费人力物力的过程。选材具体包括针对一个待制作的营养健康教育多媒体视频确定该期内容的主题，如“儿童咳嗽护理方法”，然后根据该主题内容撰写介绍这方面知识的配套解说词，然后根据解说词内容选择合适的展示图片，主要根据每句话中出现的关键词，如“儿童”、“咳嗽”，“糖浆”等，基本每句解说词就要搭配5、6张展示图片。选材完成之后，就可以通过视频制作软件将上述解说词、图片、背景音乐等内容合成一部介绍营养健康知识的视频。对于一段15分钟的左右的视频来说，大约有1000～2000字的解说词文档，需要搭配几百张展示图片。

现有的选材办法大多通过手工的方法，即人工依次截取每句解说词中的多个关键词，然后采用基于文本检索的方法在网络或者现有图片库中通过人工依次键入关键词来搜索与该关键词相匹配的图片。因此，一段15分钟左右的视频大约需要人工提取几百次关键词，并人工搜索几百次以上，不仅费时费力，而且很多工作是重复性的，如某个关键词反复出现，要重复搜索多次。据统计，整个选材的过程占据了视频制作的70%的时间。因此，发明一种快速、自动方法来制作营养健康教育多媒体视频的方法及系统是有必要的。

发明内容

（一）要解决的技术问题

本发明的目的在于解决传统营养健康教育多媒体视频的编制中选材时，需要大量的人工进行手动操作进行搜索，费时费力的问题。

（二）技术方案

本发明采用如下技术方案：

一种使用解说词文档自动生成营养健康教育视频的方法，采用以下步骤：

1）使用关键词自动提取模块，用于提取一段解说词文本中的所有关键词；

2）使用图片自动搜索模块，用于使用元搜索技术在互联网上搜索与关键词相关的图片和关键词匹配的文本检索方法在本地图片库上自动搜索与关键词相关的图片；

3）使用营养健康教育视频字幕背景生成模块，用于对搜索到的图片与原文本中的句子或/和词进行匹配，生成教育视频。

优选的，步骤1）中的关键词自动提取的方法为：基于词频统计的关键词提取方法；基于知识库搜索的关键词提取方法。

优选的，基于词频统计的关键词提取方法为：

首先使用自动分词法，即对文档使用模式匹配的方法进行分句，然后对句子使用全监督式分词模型进行分词，最后对每个词使用全监督式模型进行词性标注；