[发明专利]文章生成方法、装置及存储介质有效
申请号: | 201811541751.9 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109582945B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 蒋帅;陈思姣;梁海金;罗雨;刁世亮;卞东海 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/216;G06V20/40;G06F16/9535 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王珺;陈建焕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文章 生成 方法 装置 存储 介质 | ||
本发明实施例提出一种文章生成方法、装置及计算机可读存储介质。其中文章生成方法包括:获取与指定内容相关的视频;对所述视频进行转换,得到视频关键信息;获取所述指定内容的评论数据;利用所述视频关键信息和所述评论数据,生成所述指定内容的文章。本发明实施例通过对视频进行转换以及获取评论数据,将视频关键信息与评论数据相结合,使得用于生成文章的数据更丰富、多样,数据来源更广泛,从而使生成的文章具有更广的内容覆盖度;同时该方法具有更高的时效性,节省了人力成本和时间成本。
技术领域
本发明涉及信息技术领域,尤其涉及一种文章生成方法、装置及计算机可读存储介质。
背景技术
在文章自动生成领域,文章生成的方法包括多媒体转写自动生成文章和人工编辑文章。多媒体转写自动生成的文章大多是根据结构化的文本数据来生成文章。这种方法数据来源单一,使得生成的文章内容不够丰富、题材不够广泛。而人工编辑多媒体文章的过程十分复杂,非常耗时和繁琐,造成不必要的人力、财力的开销。例如在动图文章生成的过程中,需要通过人工在网络或者原始视频中截取精彩的片段,然后生成相应的动图,最后人为地将相应的动图聚合到一起并配上相关的文字。再有,人工编辑过程中通过人工的方法对文章相关内容的挖掘也达不到理想的效果。如何根据相关视频自动生成内容丰富多样的文章,减少人力成本和时间成本,是目前亟待解决的问题。
发明内容
本发明实施例提供一种文章生成方法、装置及计算机可读存储介质,以至少解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种文章生成方法,包括:
获取与指定内容相关的视频;
对所述视频进行转换,得到视频关键信息;
获取所述指定内容的评论数据;
利用所述视频关键信息和所述评论数据,生成所述指定内容的文章。
在一种实施方式中,所述视频关键信息包括动图和动图对应的描述信息;对所述视频进行转换,得到视频关键信息,包括:
将所述视频进行视频切分,得到指定时长的视频片段;
调用视频精彩片段服务,从所述视频片段中提取视频精彩片段;
将所述视频精彩片段转换为所述动图;
根据所述视频精彩片段,生成所述动图对应的描述信息。
在一种实施方式中,将所述视频精彩片段转换为所述动图,包括:
以对象存储的方式保存所述视频精彩片段;
通过对象存储的地址调用视频内容识别服务,从所述视频精彩片段中识别出指定精彩片段,所述指定精彩片段是包含所述指定内容的所述视频精彩片段;
通过对象存储的地址调用视频转动图服务,将所述指定精彩片段转换为动图。
在一种实施方式中,根据所述视频精彩片段,生成所述动图对应的描述信息,包括:
以对象存储的方式保存所述视频精彩片段;
通过对象存储的地址调用视频语音识别服务和/或视频文字识别服务,生成所述动图对应的描述信息。
在一种实施方式中,获取所述指定内容的评论数据,包括:
从指定网站上爬取所述指定内容的评论页面数据;
从所述评论页面数据中对评论数据进行过滤;
将过滤后的评论页面数据作为所述指定内容的评论数据。
在一种实施方式中,从所述评论页面数据中对评论数据进行过滤,包括以下方式的至少一种:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811541751.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种试卷编辑方法
- 下一篇:文字区域排版方向的确定方法及装置