[发明专利]视频会议的字幕处理方法、装置、电子设备和存储介质在审

申请号：	202211735714.8	申请日：	2022-12-30
公开（公告）号：	CN116156098A	公开（公告）日：	2023-05-23
发明（设计）人：	张美聪;李阔;杨春晖	申请（专利权）人：	视联动力信息技术股份有限公司
主分类号：	H04N7/15	分类号：	H04N7/15;H04N21/2343;H04N21/488;G10L15/22;G10L15/26
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	杨柳苑
地址：	100000 北京市东城区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频会议字幕处理方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了视频会议的字幕处理方法、装置、电子设备和存储介质，该方法包括：在进行视频会议的过程中，接收视频会议服务器发送的视频数据和音频数据，确定音频数据对应的文本信息；确定文本信息中的目标信息；将文本信息作为字幕融合至视频数据中，并对文本信息设置字幕样式，其中，目标信息和文本信息中的其他词语设置不同字幕样式；播放视频数据对应的视频画面，并根据文本的字幕样式在视频画面中显示文本信息。从而使得会议中的用户不仅可以听到参会者的音频，还可以看到对应的字幕以及会议内容的重点词汇，解决了由于发言者说话不标准，或者语速过快等导致其他人无法正确理解其表达内容的问题，提升了会议质量。

技术领域

本发明涉及视频会议技术领域，特别是涉及一种视频会议的字幕处理方法、一种视频会议的字幕处理装置、一种电子设备和一种计算机可读存储介质。

背景技术

在传统的视联网会议中，通常有一个主席角色、一个发言人角色、以及众多的参会者，当主席或者发言人在发言时，其他参会者可以实时看到主席或者发言人的画面，以及听到主席或者发言人的声音。然而，由于发言者说话不标准，或者语速过快等问题，往往导致其他人无法听清楚其说话的内容。

发明内容

鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频会议的字幕处理方法、一种视频会议的字幕处理装置、一种电子设备和一种计算机可读存储介质。

为了解决上述问题，本发明实施例公开了一种视频会议的字幕处理方法，应用于视频会议终端，所述视频会议终端与视频会议服务器通信连接，所述方法包括：

在进行视频会议的过程中，接收所述视频会议服务器发送的视频数据和音频数据，确定所述音频数据对应的文本信息；

确定所述文本信息中的目标信息；

将所述文本信息作为字幕融合至所述视频数据中，并对所述文本信息设置字幕样式，其中，所述目标信息和所述文本信息中的其他词语设置不同字幕样式；

播放所述视频数据对应的视频画面，并根据所述文本的字幕样式在所述视频画面中显示所述文本信息。

可选地，所述确定所述文本信息中的目标信息，包括：