[发明专利]字幕实时翻译方法、系统、电子设备及存储介质有效
申请号: | 202110595020.8 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113438542B | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 李轩;李青龙;李际朝;张旺;郑才松;孔燕鹏 | 申请(专利权)人: | 北京智慧星光信息技术有限公司 |
主分类号: | H04N21/435 | 分类号: | H04N21/435;H04N21/4782;H04N21/488;G06F40/58;G06F40/42 |
代理公司: | 北京智宇正信知识产权代理事务所(普通合伙) 11876 | 代理人: | 李明卓 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字幕 实时 翻译 方法 系统 电子设备 存储 介质 | ||
本发明公开了一种字幕实时翻译方法、系统、电子设备及存储介质,该方法包括:对获取到的页面源码数据进行数据解析,得到字幕的位置信息;按照预设提取时间间隔实时提取位置信息所对应的标签的原始字幕数据;判断当前时刻提取到的原始字幕数据是否与上一时刻提取到的原始字幕数据相同;若当前时刻提取到的原始字幕数据与上一时刻提取到的原始字幕数据不相同,则将当前时刻提取到的原始字幕数据发送至翻译服务,以便翻译服务对接收到的原始字幕数据进行字幕翻译,待字幕翻译完成后发送翻译字幕数据;接收翻译服务发送的翻译字幕数据;对翻译字幕数据增加标签属性组成DOM树;将DOM树插入到html页面中进行翻译字幕数据的实时显示;实现了字幕的实时翻译。
技术领域
本发明涉及数据处理领域,具体涉及到一种字幕实时翻译方法、系统、电子设备及存储介质。
背景技术
随着时代的发展,网络技术越来越进步,通过视频浏览器观看国内外视频成为了人们日常生活中的一部分。当观看非母语语言的视频时,语言问题是影响视频观看的最大问题之一,很多人由于语言障碍不得不放弃了非母语视频的观看。基于此,字幕翻译成为亟待解决的一个技术问题。
发明内容
有鉴于此,本发明实施例提供了一种字幕实时翻译方法、系统、电子设备及存储介质,以实现字幕的实时翻译。
为此,本发明实施例中提供了如下技术方案:
根据第一方面,本发明实施例中提供了一种字幕实时翻译方法,包括:获取html页面的页面源码数据;对页面源码数据进行数据解析,得到html页面中字幕的位置信息;按照预设提取时间间隔实时提取位置信息所对应的标签的原始字幕数据;判断当前时刻提取到的原始字幕数据是否与上一时刻提取到的原始字幕数据相同;若当前时刻提取到的原始字幕数据与上一时刻提取到的原始字幕数据不相同,则将当前时刻提取到的原始字幕数据发送至翻译服务,以便翻译服务对接收到的原始字幕数据进行字幕翻译,待字幕翻译完成后发送翻译字幕数据;接收翻译服务发送的翻译字幕数据;对翻译字幕数据增加标签属性,组成DOM树;将DOM树插入到html页面中进行翻译字幕数据的实时显示。
可选地,翻译服务对接收到的原始字幕数据进行字幕翻译,待字幕翻译完成后发送翻译字幕数据的步骤中,包括:获取语种翻译类型,语种翻译类型包括html页面的原始语种类型和html页面翻译后所对应的目标语种类型;根据语种翻译类型在语种翻译模型库中匹配对应的字幕翻译模型;利用flaskweb框架,加载字幕翻译模型并搭建成翻译服务;接收原始字幕数据;将原始字幕数据输入至字幕翻译模型中进行字幕翻译,得到翻译字幕数据;发送翻译字幕数据。
可选地,发送翻译字幕数据的步骤中,包括:将原始字幕数据与翻译字幕数据进行逐句对应,得到字幕翻译对照数据;发送字幕翻译对照数据。
可选地,接收翻译服务发送的翻译字幕数据的步骤之前,还包括:关闭原始字幕数据的显示。
可选地,将DOM树插入到html页面中进行翻译字幕数据的实时显示的步骤中,包括:构建预设个数的翻译字幕存储节点;接收到新翻译字幕数据后,将后一个翻译字幕存储节点中的翻译字幕数据传递至前一个翻译字幕存储节点中,将接收到的新翻译字幕数据传递至最后一个翻译字幕存储节点中。
可选地,将接收到的新翻译字幕数据传递至最后一个翻译字幕存储节点中的步骤之后,还包括:获取新翻译字幕数据后的空闲时间间隔;判断所述空闲时间间隔是否大于预设空闲时间阈值;若所述空闲时间间隔大于所述预设空闲时间阈值,则关闭翻译字幕数据;若所述空闲时间间隔小于或者等于所述预设空闲时间阈值,则继续显示翻译字幕数据。
可选地,对页面源码数据进行数据解析,得到html页面中字幕的位置信息的步骤中,包括:根据页面源码数据确定html页面字幕标签的标签属性和字幕标签所对应的父节点;根据标签属性遍历父节点下的所有子节点,得到每一个子节点所对应的字幕详细位置;将每一个子节点所对应的字幕详细位置组成html页面中字幕的位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智慧星光信息技术有限公司,未经北京智慧星光信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110595020.8/2.html,转载请声明来源钻瓜专利网。