[发明专利]一种球类赛事文字解说生成方法有效
申请号: | 202110678945.9 | 申请日: | 2021-06-18 |
公开(公告)号: | CN113312923B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 王莹;黄国恒;程良伦;付阳;包文圳 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06N3/0464;G06N3/0442 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘思言 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 球类 赛事 文字 解说 生成 方法 | ||
1.一种球类赛事文字解说生成方法,其特征在于,包括:
获取赛事视频中各帧图像的视觉特征;
将所述赛事视频的视觉特征和所述赛事视频的比赛专业词汇标签输入到预置语义概率模型进行处理,得到运动员动作、球运动轨迹以及赛事解说关键词的语义概念向量;
将所述视觉特征和所述语义概念向量输入到预置语言生成模型,生成所述赛事视频的文字解说;
所述获取赛事视频中各帧图像的视觉特征,包括:
通过二维卷积神经网络模型提取赛事视频中各帧图像的时间位置特征,所述二维卷积神经网络模型用于提取随时间推移的运动员动作和球的位置变换的时间位置特征;
通过三维卷积神经网络模型提取赛事视频中各帧图像的空间位置特征,所述三维卷积神经网络模型用于提取脚步步伐、手部操作以及球运动轨迹的空间位置特征;
融合所述时间位置特征和所述空间位置特征,得到视觉特征;
所述将所述赛事视频的视觉特征和所述赛事视频的比赛专业词汇标签输入到预置语义概率模型进行处理,得到运动员动作、球运动轨迹以及赛事解说关键词的语义概念向量,之后还包括:
根据各所述语义概念向量的贡献率对所有所述语义概念向量进行特征融合,得到融合后语义概念向量;
相应的,所述将所述视觉特征和所述语义概念向量输入到预置语言生成模型,生成所述赛事视频的文字解说,包括:
将所述视觉特征和所述融合后语义概念向量输入到预置语言生成模型,生所述赛事视频的文字解说。
2.根据权利要求1所述的球类赛事文字解说生成方法,其特征在于,所述预置语言生成模型为LSTM模型。
3.根据权利要求1所述的球类赛事文字解说生成方法,其特征在于,所述预置语义概率模型的损失函数
式中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110678945.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种沃柑避雨栽培方法
- 下一篇:基于混合神经网络的远程监督关系抽取方法及装置