[发明专利]标题生成方法、设备及存储介质在审
申请号: | 202111669360.7 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114363714A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 王彬;邢政;潘攀;徐文博;魏传勇 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N21/439;H04N21/44;H04N21/478 |
代理公司: | 北京同钧律师事务所 16037 | 代理人: | 李小波;许怀远 |
地址: | 310056 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标题 生成 方法 设备 存储 介质 | ||
本申请提供一种标题生成方法、设备及存储介质,其中方法包括:获取目标对象的原始信息以及所述目标对象对应的视频,并从所述视频中提取所述目标对象的相关信息;根据所述原始信息、所述相关信息以及所述视频,基于标题生成模型,生成所述视频对应的标题。本申请可以基于模型自动生成标题,无需人工花费大量时间精力去编辑标题,提高了标题生成的效率,并且,通过目标对象的原始信息、视频以及从视频中提取出的相关信息,能够融合目标对象的多种信息,提高标题与目标对象的匹配度,提升标题生成的准确性及用户体验。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种标题生成方法、设备及存储介质。
背景技术
随着互联网技术的不断发展,视频类内容的应用也越来越广泛。相比于传统的图文详情描述,视频类内容尤其是短视频,可以提供给用户更丰富的视听信息,带来不一样的感官体验。
其中,视频的标题是视频制作中非常重要的一环,好的标题能正确反映视频所传达的内容,帮助观众快速了解视频并产生记忆和联想力,提升用户体验。
目前,视频的标题往往依赖于用户手动生成,需要用户网上搜索了解热门标题的套路,并与视频中的目标对象的信息进行有效结合,这一过程费时费力,效率低下,且生成的标题效果较差。
发明内容
本申请实施例的主要目的在于提供一种标题生成方法、设备及存储介质,以提升为视频生成标题的效率和准确性。
第一方面,本申请实施例提供一种标题生成方法,包括:
获取目标对象的原始信息以及所述目标对象对应的视频,并从所述视频中提取所述目标对象的相关信息;
根据所述原始信息、所述相关信息以及所述视频,基于标题生成模型,生成所述视频对应的标题。
可选的,获取目标对象的原始信息以及所述目标对象对应的视频,并从所述视频中提取所述目标对象的相关信息,包括:
从所述目标对象对应的页面展示信息中,提取下述至少一项原始信息:所述目标对象对应的原始标题、描述信息和所述目标对象的主图;
获取所述目标对象对应的视频,并执行下述至少一项:
检测所述视频中的文本信息及音乐信息;
在所述视频中检测所述目标对象出现时的场景信息、所述目标对象的属性信息;
检测所述视频中的发言角色信息,并提取出发言语音,将所述发言语音转换为文本信息。
可选的,根据所述原始信息、所述相关信息以及所述视频,基于标题生成模型,生成所述视频对应的标题,包括:
针对所述原始信息、相关信息中的每一项信息,根据该信息与所述视频,基于标题生成模型,生成该信息对应的标题;
根据各个信息对应的标题的文本匹配程度,对各个信息对应的标题进行融合,确定所述视频对应的至少一个标题。
可选的,所述标题生成模型包括编码器和解码器;根据所述原始信息、所述相关信息以及所述视频,基于标题生成模型,生成所述视频对应的标题,包括:
通过所述编码器提取所述原始信息、所述相关信息以及所述视频的特征信息,所述特征信息用于表征在跨模态空间中的位置;
根据提取到的特征信息,通过解码器生成对应的标题。
可选的,根据提取到的特征信息,通过解码器生成对应的标题,包括:
将所述特征信息输入到解码器,根据标题生成策略,生成标题文本并对所述标题文本进行随机采样,得到对应的标题;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111669360.7/2.html,转载请声明来源钻瓜专利网。