[发明专利]使用解说词文档自动生成营养健康教育视频的方法及系统有效
申请号: | 201310291597.5 | 申请日: | 2013-07-11 |
公开(公告)号: | CN103324760A | 公开(公告)日: | 2013-09-25 |
发明(设计)人: | 杨颖;陈瑛;高万林 | 申请(专利权)人: | 中国农业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100193 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 解说词 文档 自动 生成 营养 健康 教育 视频 方法 系统 | ||
技术领域
本发明涉及多媒体技术领域,特别涉及一种使用解说词文档自动提取关键词并搜索相关图片生成营养健康教育视频的方法及系统。
背景技术
根据解说词全自动生成视频的方法和系统是根据文本中相对应的词,主要是名词进行网络或/和本地的相关图片搜索,但是汉语本身的语言特性决定了其词性的复杂性,从而导致词性的划分不准确,所寻找到的图片也不准确,因此对于根据解说词全自动生成视频的方法和系统的研究也少有涉及。经研究表明,在营养健康教育领域,语句的复杂度较低,词性相对确定,具备了机器自动识别词性,自动寻找关键词及获取相关图片,自动生成多媒体视频的先决条件。
营养健康教育多媒体视频的编制需要经过选材、编辑和制作等过程,其中选材过程是其中工作量最大,最耗费人力物力的过程。选材具体包括针对一个待制作的营养健康教育多媒体视频确定该期内容的主题,如“儿童咳嗽护理方法”,然后根据该主题内容撰写介绍这方面知识的配套解说词,然后根据解说词内容选择合适的展示图片,主要根据每句话中出现的关键词,如“儿童”、“咳嗽”,“糖浆”等,基本每句解说词就要搭配5、6张展示图片。选材完成之后,就可以通过视频制作软件将上述解说词、图片、背景音乐等内容合成一部介绍营养健康知识的视频。对于一段15分钟的左右的视频来说,大约有1000~2000字的解说词文档,需要搭配几百张展示图片。
现有的选材办法大多通过手工的方法,即人工依次截取每句解说词中的多个关键词,然后采用基于文本检索的方法在网络或者现有图片库中通过人工依次键入关键词来搜索与该关键词相匹配的图片。因此,一段15分钟左右的视频大约需要人工提取几百次关键词,并人工搜索几百次以上,不仅费时费力,而且很多工作是重复性的,如某个关键词反复出现,要重复搜索多次。据统计,整个选材的过程占据了视频制作的70%的时间。因此,发明一种快速、自动方法来制作营养健康教育多媒体视频的方法及系统是有必要的。
发明内容
(一)要解决的技术问题
本发明的目的在于解决传统营养健康教育多媒体视频的编制中选材时,需要大量的人工进行手动操作进行搜索,费时费力的问题。
(二)技术方案
本发明采用如下技术方案:
一种使用解说词文档自动生成营养健康教育视频的方法,采用以下步骤:
1)使用关键词自动提取模块,用于提取一段解说词文本中的所有关键词;
2)使用图片自动搜索模块,用于使用元搜索技术在互联网上搜索与关键词相关的图片和关键词匹配的文本检索方法在本地图片库上自动搜索与关键词相关的图片;
3)使用营养健康教育视频字幕背景生成模块,用于对搜索到的图片与原文本中的句子或/和词进行匹配,生成教育视频。
优选的,步骤1)中的关键词自动提取的方法为:基于词频统计的关键词提取方法;基于知识库搜索的关键词提取方法。
优选的,基于词频统计的关键词提取方法为:
首先使用自动分词法,即对文档使用模式匹配的方法进行分句,然后对句子使用全监督式分词模型进行分词,最后对每个词使用全监督式模型进行词性标注;
然后使用词频统计法,即在已经标注过词性的词中筛选出名词,对每一个名词统计其在解说文档中的词频,最后把排名靠前的名词作为该解说文档的关键词。
优选的,基于知识库搜索的关键词提取方法为:
采用爬虫技术下载网络百科词典,获取相应的百科词条;
对于每一个解说词文档,使用模式匹配的方法进行分句;
对于每一个句子,使用模式匹配的方法提取出其中出现的百科词条。
优选的,步骤2)中的互联网图片自动搜索法为:
首先将每个关键词设置为查询词,并调用搜索引擎,检索相关高画质图片;
然后将搜索引擎搜索到的图片进行整合,存储在以该关键词命名的图片存储目录下。
优选的,步骤2)中的本地图片自动搜索法为:将每个关键词设置为查询词,依次搜索本地各级文件存储目录,查找文件名包含关键词的图片,找到之后存储在以该关键词命名的图片存储目录下。
优选的,步骤3)中的营养健康教育视频字幕背景生成方法为:首先使用解说词自动换行截取法,然后使用解说词文本和图像的对齐匹配法进行营养健康教育视频字幕背景的生成。
优选的,使用解说词自动换行截取法为:
首先采用模式匹配的方法将解说词文档分句,并将解说词中的标点符号全部去掉,对于每一个句子,通过采用全监督式分词模型进行分词,获取任意相邻两个词的分割位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310291597.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:零速接纸机储纸辊及其静动态分析方法
- 下一篇:一种网站信息采编管理系统