[发明专利]视频会议的字幕处理方法、装置、电子设备和存储介质在审
申请号: | 202211735714.8 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116156098A | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 张美聪;李阔;杨春晖 | 申请(专利权)人: | 视联动力信息技术股份有限公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15;H04N21/2343;H04N21/488;G10L15/22;G10L15/26 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 杨柳苑 |
地址: | 100000 北京市东城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频会议 字幕 处理 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供了视频会议的字幕处理方法、装置、电子设备和存储介质,该方法包括:在进行视频会议的过程中,接收视频会议服务器发送的视频数据和音频数据,确定音频数据对应的文本信息;确定文本信息中的目标信息;将文本信息作为字幕融合至视频数据中,并对文本信息设置字幕样式,其中,目标信息和文本信息中的其他词语设置不同字幕样式;播放视频数据对应的视频画面,并根据文本的字幕样式在视频画面中显示文本信息。从而使得会议中的用户不仅可以听到参会者的音频,还可以看到对应的字幕以及会议内容的重点词汇,解决了由于发言者说话不标准,或者语速过快等导致其他人无法正确理解其表达内容的问题,提升了会议质量。
技术领域
本发明涉及视频会议技术领域,特别是涉及一种视频会议的字幕处理方法、一种视频会议的字幕处理装置、一种电子设备和一种计算机可读存储介质。
背景技术
在传统的视联网会议中,通常有一个主席角色、一个发言人角色、以及众多的参会者,当主席或者发言人在发言时,其他参会者可以实时看到主席或者发言人的画面,以及听到主席或者发言人的声音。然而,由于发言者说话不标准,或者语速过快等问题,往往导致其他人无法听清楚其说话的内容。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频会议的字幕处理方法、一种视频会议的字幕处理装置、一种电子设备和一种计算机可读存储介质。
为了解决上述问题,本发明实施例公开了一种视频会议的字幕处理方法,应用于视频会议终端,所述视频会议终端与视频会议服务器通信连接,所述方法包括:
在进行视频会议的过程中,接收所述视频会议服务器发送的视频数据和音频数据,确定所述音频数据对应的文本信息;
确定所述文本信息中的目标信息;
将所述文本信息作为字幕融合至所述视频数据中,并对所述文本信息设置字幕样式,其中,所述目标信息和所述文本信息中的其他词语设置不同字幕样式;
播放所述视频数据对应的视频画面,并根据所述文本的字幕样式在所述视频画面中显示所述文本信息。
可选地,所述确定所述文本信息中的目标信息,包括:
从所述文本信息中提取目标词语或目标短语;
将所述目标词语或目标短语与预置关键词进行匹配;
若匹配成功,则确定所述目标词语或目标短语为目标信息。
可选地,还包括:
获取针对当前视频会议的预置关键词,所述预置关键词用于表征在文本信息作为字幕融合至所述视频数据中,提取所述目标信息以使所述目标信息区别于所述文本信息中的其他词语进行展示。
可选地,所述确定所述文本信息中的目标信息,包括:
统计所述文本信息重复出现的目标词语或目标短语;
若所述重复出现的目标词语或目标短语的出现频率大于所述预设频率阈值,则确定所述重复出现的目标词语或目标短语为高频词;
从所述文本信息中提取所述高频词,将所述高频词作为目标信息。
可选地,所述对所述文本信息设置字幕样式,包括:
按照音频数据不同的来源对所述文本信息设置不同的字幕样式;其中,所述字幕样式包括文字大小、字体格式、字体颜色。
可选地,所述对所述文本信息设置字幕样式,包括:
按照不同的所述目标信息对所述文本设置不同的字幕样式;其中,所述字幕样式包括文字大小、字体格式、字体颜色。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于视联动力信息技术股份有限公司,未经视联动力信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211735714.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于座椅表皮抗褶皱性能检测方法
- 下一篇:一种具有缓冲机构的座椅滑轨