[发明专利]基于文本的网页内容生成视频摘要的方法、装置及系统在审
申请号: | 201510156123.9 | 申请日: | 2015-04-03 |
公开(公告)号: | CN104731959A | 公开(公告)日: | 2015-06-24 |
发明(设计)人: | 李国祥 | 申请(专利权)人: | 北京威扬科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王术兰 |
地址: | 100000 北京市朝阳区关东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 网页 内容 生成 视频 摘要 方法 装置 系统 | ||
1.一种基于文本的网页内容生成视频摘要的方法,其特征在于,包括:
提取目标新闻网页文本内容的文本摘要;
解析所述文本摘要,得到所述文本摘要中的关键词;
对所述关键词进行语义分析,得到所述关键词本体语义;
基于所述关键词本体语义,从互联网络中检索对应的图片或视频,形成背景图;
基于所述关键词本体语义,从预先设立的语法数据库中获取与所述关键词对应的动画模板;
将所述文本摘要转化为音频数据;
按照预设渲染规则,将所述背景图、所述动画模板及所述音频数据合成渲染为视频文件。
2.根据权利要求1所述的方法,其特征在于,所述提取目标新闻网页文本内容的文本摘要,包括:
基于网页链接,获取新闻网页;
去除所述新闻网页中的附加信息,其中所述附加信息包括以下一种或多种:广告、图片、视频、框架及图表;
提取去除所属附加信息后的所述新闻网页的文本内容;
从所述文本内容中摘取重点语句组成所述文本摘要。
3.根据权利要求2所述的方法,其特征在于,所述从所述文本内容中摘取重点语句组成所述文本摘要,包括:
依次计算所述文本内容中每两句语句之间的相似性;
根据所述相似性的计算结果,对所述文本内容中的语句分类;
按照所述分类的结果,从每类语句中分别提取语句进行组合,得到候选摘要;
从所述候选摘要中选取与预设文本摘要长度差值最小的候选摘要作为所述新闻网页的摘要文本,其中所述预设文本摘要长度根据待生成的视频长度和预先设定的文本摘要朗读速度确定。
4.根据权利要求3所述的方法,其特征在于,所述依次计算所述文本内容中每两句语句之间的相似性,包括:
计算当前两句语句中共有词语的数量之和;
将所述数量之和除以当前两句语句的长度平均值,得到当前两句语句的相似性;
依照获取当前两句语句的相似性的方法计算所述文本内容中每两句语句之间的相似性。
5.根据权利要求1所述的方法,其特征在于,所述解析所述文本摘要,得到所述文本摘要中的关键词,包括:
对所述文本摘要进行分词;
将所述分词后得到的词语与所述语法数据库中的词语模板进行比对,确定分词后得到的词语的词性;
根据所述词性的判断结果,从分词后的词语中选取名词及数词作为所述文本摘要的关键词。
6.根据权利要求1所述的方法,其特征在于,所述对所述关键词进行语义分析,得到所述关键词本体语义,包括:
在所述语法数据库中检索所述关键词,获取与所述关键词相关的所有本体描述;
利用网络本体语言OWL从所述关键词的所有本体描述中确定出当前语境下的关键词本体语义。
7.根据权利要求1所述的方法,其特征在于,所述按照预设渲染规则,将所述背景图、所述动画模板及所述音频数据合成渲染为视频文件,包括:
设定所述音频数据中所述关键词、与所述关键词对应的背景图及动画模板的映射关系;
按照所述映射关系,对所述背景图、所述动画模板及所述音频数据进行合成渲染。
8.一种基于文本的网页内容生成视频摘要的装置,其特征在于,包括:
提取模块,用于提取目标新闻网页文本内容的文本摘要;
关键词获取模块,用于解析所述文本摘要,得到所述文本摘要中的关键词;
语义分析模块,用于对所述关键词进行语义分析,得到所述关键词本体语义;
背景图形成模块,用于基于所述关键词本体语义,从互联网络中检索对应的图片或视频,形成背景图;
动画模板获取模块,用于基于所述关键词本体语义,从预设的语法数据库中获取与所述关键词对应的动画模板;
音频转换模块,用于将所述文本摘要转化为音频数据;
视频合成模块,用于按照预设渲染规则,将所述背景图、所述动画模板及所述音频数据合成渲染为视频文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京威扬科技有限公司;,未经北京威扬科技有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510156123.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一体机的多媒体文件自动归类方法及系统
- 下一篇:基于群透视音乐推荐方法与系统
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法