[发明专利]基于神经网络的内容标题生成方法、装置、设备、和计算机可读存储介质有效
申请号: | 202010952667.7 | 申请日: | 2020-09-11 |
公开(公告)号: | CN112104919B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 陈小帅 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N21/84 | 分类号: | H04N21/84;H04N21/44;H04N21/439;H04N21/435;G06F16/74;G06F40/258;G06F40/216;G06V10/40;G06V10/82;G06N3/04 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 孙之刚;陈岚 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 内容 标题 生成 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种基于神经网络的内容标题生成方法,其特征在于:所述神经网络包括编码器—解码器网络,所述方法包括:
针对所述内容的至少两种类型的信息,分别生成所述至少两种类型的信息中的每一种类型的信息的向量表示,其中所述至少两种类型的信息中的一种是文本,所述内容中的所述至少两种类型的信息还包括图像和音频,以及所述文本包括以下中的一个或多个:所述内容的字幕、弹幕、评论和现有标题;
利用所述编码器—解码器网络的各个编码器分别处理所述每一种类型的信息的向量表示;
利用所述编码器—解码器网络的解码器对所述编码器—解码器网络的各个编码器的输出进行处理,生成所述内容的一个或多个标题词,其中所述编码器—解码器网络的解码器通过计算所述文本中的词的注意力权重来计算所述文本中的词的拷贝概率,其中基于所述每一种类型的信息的向量表示来计算所述文本中的词的注意力权重,从而确定是从所述文本中的词中拷贝来生成标题词,还是从词表示中来生成标题词,所述词表示是所述文本的向量表示经所述编码器—解码器网络的编码器处理后生成的,其中所述注意力权重表示所述文本中的词对于内容标题的相关性,所述拷贝概率表示所述文本中的词拷贝成为标题词的概率;以及
基于所述一个或多个标题词生成所述内容标题。
2.如权利要求1所述的方法,其特征在于,针对所述一个或多个标题词中的每一个标题词,所述编码器—解码器网络的解码器均执行一次以下计算步骤:通过计算所述文本中的词的注意力权重来计算所述文本中的词的拷贝概率,从而确定是从所述文本中的词中拷贝来生成每一个标题词,还是从词表示中来生成每一个标题词。
3.如权利要求1所述的方法,其特征在于:当所述至少两种类型的信息中的一种类型的信息是音频,所述利用所述编码器—解码器网络的各个编码器分别处理所述每一种类型的信息的向量表示包括:
获取所述内容的音频帧序列;
针对所述音频帧序列中的每个音频帧,利用音频特征提取模型进行处理,以生成所述每个音频帧的向量表示。
4.如权利要求3所述的方法,其特征在于:所述音频特征提取模型包括VGGish或YAMNet。
5.如权利要求1所述的方法,其特征在于:当所述至少两种类型的信息中的一种类型的信息是图像,所述利用所述编码器—解码器网络的各个编码器分别处理所述每一种类型的信息的向量表示包括:
获取所述内容的图像或图像序列;
针对所述图像或所述图像序列中的每个图像,利用图像特征提取模型进行处理,以生成所述图像或所述图像序列中的每个图像的向量表示。
6.如权利要求5所述的方法,其特征在于:所述图像特征提取模型包括残差网络或Inception卷积神经网络。
7.如权利要求1所述的方法,其特征在于,所述编码器—解码器网络的编码器包括Transformer编码器,所述编码器—解码器网络的解码器包括Transformer解码器。
8.如权利要求1所述的方法,其特征在于,还包括以下步骤中的至少一个:
基于以下一项或多项而选取所述内容:一个统计时间段内所述内容的播放量、播放完成度、观众互动程度;
基于以下一项或多项选取所述神经网络的训练数据:一段时间内内容的播放量、播放完成度、观众互动程度。
9.如权利要求8所述的方法,其特征在于,所述选取是从较长的内容中截取。
10.如权利要求1所述的方法,其特征在于,所述基于所述一个或多个标题词生成所述内容的标题包括:
选择所述一个或多个标题词中生成概率最大的标题词作为所述内容的标题,或者
响应于基于所述一个或多个标题词的编辑输入,生成所述内容的标题。
11.如权利要求1所述的方法,其特征在于,所述内容是短视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010952667.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种独立式外置弹簧泵泵芯
- 下一篇:一种环保型泡沫泵泵芯
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法