[发明专利]基于文本的网页内容生成视频摘要的方法、装置及系统在审
申请号: | 201510156123.9 | 申请日: | 2015-04-03 |
公开(公告)号: | CN104731959A | 公开(公告)日: | 2015-06-24 |
发明(设计)人: | 李国祥 | 申请(专利权)人: | 北京威扬科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王术兰 |
地址: | 100000 北京市朝阳区关东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 网页 内容 生成 视频 摘要 方法 装置 系统 | ||
技术领域
本发明涉及视频生成领域,具体而言,涉及基于文本的网页内容生成视频摘要的方法、装置及系统。
背景技术
新闻网站,指以经营新闻业务为主要生存手段的网站。包括国家大型新闻门户,商业门户,地方新闻门户,还有各种行业门户网站也充当了该行业的新闻网站。
现有的新闻网站,新闻展示一般基于文字及图片来描述。目前用户通过越来越多的途径,例如手机、平板电脑、电视等,来获取新闻的内容。现有的新闻类应用从新闻网站获取新闻的也多以文字图片为主。
现有的新闻网站上新闻的缺点是在内容快速消费时代,用户阅读文字的时间成本相对提高,不利于新闻网站用文字向用户展示新闻。
发明内容
本发明的目的在于提供一种基于文本的网页内容生成视频摘要的方法、装置及系统,用生成视频摘要的方式向用户展示网页上的新闻,以节省用户阅读新闻网页上新闻的时间成本。
第一方面,本发明实施例提供了一种文本的网页内容生成视频摘要的方法,包括:提取目标新闻网页文本内容的文本摘要;解析所述文本摘要,得到所述文本摘要中的关键词;对所述关键词进行语义分析,得到所述关键词本体语义;基于所述关键词本体语义,从互联网络中检索对应的图片或视频,形成背景图,形成背景图;基于所述关键词本体语义,从预先设立的语法数据库中获取与所述关键词对应的动画模板;将所述文本摘要转化为音频数据;按照预设渲染规则,将所述背景图、所述动画模板及所述音频数据合成渲染为视频文件。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述提取目标新闻网页文本内容的文本摘要包括:基于网页链接,获取新闻网页;去除所述新闻网页中的附加信息,其中所述附加信息包括以下一种或多种:广告、图片、视频、框架及图表;提取去除所属附加信息后的所述新闻网页的文本内容;从所述文本内容中摘取重点语句组成所述文本摘要。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述从所述文本内容中摘取重点语句组成所述文本摘要,包括:依次计算所述文本内容中每两句语句之间的相似性;根据所述相似性的计算结果,对所述文本内容中的语句分类;按照所述分类的结果,从每类语句中分别提取语句进行组合,得到候选摘要;从所述候选摘要中选取与预设文本摘要长度差值最小的候选摘要作为所述新闻网页的摘要文本,其中所述预设文本摘要长度根据待生成的视频长度和预先设定的文本摘要朗读速度确定。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述依次计算所述文本内容中每两句语句之间的相似性,包括:计算当前两句语句中共有词语的数量之和;将所述数量之和除以当前两句语句的长度平均值,得到当前两句语句的相似性;依照获取当前两句语句的相似性的方法计算所述文本内容中每两句语句之间的相似性。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述解析所述文本摘要,得到所述文本摘要中的关键词,包括:对所述文本摘要进行分词;将所述分词后得到的词语与所述语法数据库中的词语模板进行比对,确定分词后得到的词语的词性;根据所述词性的判断结果,从分词后的词语中选取名词及数词作为所述文本摘要的关键词。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述对所述关键词进行语义分析,得到所述关键词本体语义,包括:在所述语法数据库中检索所述关键词,获取与所述关键词相关的所有本体描述;利用网络本体语言OWL从所述关键词的所有本体描述中确定出当前语境下的关键词本体语义。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述按照预设渲染规则,将所述背景图、所述动画模板及所述音频数据合成渲染为视频文件,包括:设定所述音频数据中所述关键词、与所述关键词对应的背景图及动画模板的映射关系;按照所述映射关系,对所述背景图、所述动画模板及所述音频数据进行合成渲染。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京威扬科技有限公司;,未经北京威扬科技有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510156123.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一体机的多媒体文件自动归类方法及系统
- 下一篇:基于群透视音乐推荐方法与系统
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法