[发明专利]文章生成方法、装置及存储介质有效
申请号: | 201811541751.9 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109582945B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 蒋帅;陈思姣;梁海金;罗雨;刁世亮;卞东海 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/216;G06V20/40;G06F16/9535 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王珺;陈建焕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文章 生成 方法 装置 存储 介质 | ||
1.一种文章生成方法,其特征在于,包括:
获取与指定内容相关的视频;
对所述视频进行切分、切分结果的筛选和筛选结果的动图转换,得到视频关键信息;所述视频关键信息包括所述与指定内容相关的视频的动图,以及对所述动图的描述信息;
获取所述指定内容的评论数据;
获取所述指定内容的知识图谱;
获取与所述知识图谱相关的图谱内容数据;
利用所述视频关键信息、所述评论数据和所述图谱内容数据,生成所述指定内容的文章;
所述对所述视频进行切分、切分结果的筛选和筛选结果的动图转换,得到视频关键信息,包括:
将所述视频进行视频切分,得到指定时长的视频片段;
调用视频精彩片段服务,利用图像识别技术从所述视频片段中提取包含所述指定内容的视频精彩片段;
将所述视频精彩片段转换为所述动图;
根据所述视频精彩片段,生成所述动图对应的描述信息。
2.根据权利要求1所述的方法,其特征在于,将所述视频精彩片段转换为所述动图,包括:
以对象存储的方式保存所述视频精彩片段;
通过对象存储的地址调用视频内容识别服务,从所述视频精彩片段中识别出指定精彩片段,所述指定精彩片段是包含所述指定内容的所述视频精彩片段;
通过对象存储的地址调用视频转动图服务,将所述指定精彩片段转换为动图。
3.根据权利要求1所述的方法,其特征在于,根据所述视频精彩片段,生成所述动图对应的描述信息,包括:
以对象存储的方式保存所述视频精彩片段;
通过对象存储的地址调用视频语音识别服务和/或视频文字识别服务,生成所述动图对应的描述信息。
4.根据权利要求1-3中任一项所述的方法,其特征在于,获取所述指定内容的评论数据,包括:
从指定网站上爬取所述指定内容的评论页面数据;
从所述评论页面数据中对评论数据进行过滤;
将过滤后的评论页面数据作为所述指定内容的评论数据。
5.根据权利要求4所述的方法,其特征在于,从所述评论页面数据中对评论数据进行过滤,包括以下方式的至少一种:
统计所述评论页面数据中出现的指定词的词频,在所述指定词的词频大于等于预设词频阈值的情况下,将该评论页面数据过滤掉;
统计所述评论页面数据中的评论字数,在所述评论字数少于预设字数阈值的情况下,将该评论页面数据过滤掉;
统计所述评论页面数据中的点赞次数,在所述点赞次数少于预设点赞次数阈值的情况下,将该评论页面数据过滤掉。
6.根据权利要求4所述的方法,其特征在于,从所述评论页面数据中对评论数据进行过滤,包括:
利用机器学习模型评价所述评论页面数据,得到评价分数;
将评价分数低于预设分数阈值的评论页面数据过滤掉。
7.根据权利要求1-3中任一项所述的方法,其特征在于,利用所述视频关键信息和所述评论数据,生成所述指定内容的文章,包括:
通过文章模板以及话术语料,生成所述指定内容的文章。
8.根据权利要求1-3中任一项所述的方法,其特征在于,利用所述视频关键信息和所述评论数据,生成所述指定内容的文章,还包括:
检测所述视频关键信息和所述评论数据的数据量;
在所述数据量达到预设的数据量阈值时,触发生成所述指定内容的文章。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811541751.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种试卷编辑方法
- 下一篇:文字区域排版方向的确定方法及装置