[发明专利]一种单双语字幕修改查找处理方法及系统有效
申请号: | 202010784084.8 | 申请日: | 2020-08-06 |
公开(公告)号: | CN112104917B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 王正航 | 申请(专利权)人: | 武汉译满天下科技有限公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N21/435;H04N21/81;H04N5/278;G06F40/42 |
代理公司: | 武汉智权专利代理事务所(特殊普通合伙) 42225 | 代理人: | 邱云雷 |
地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 双语 字幕 修改 查找 处理 方法 系统 | ||
1.一种单双语字幕修改查找处理方法,其特征在于,包括以下步骤:
获取完成修改的单语字幕文件,以及翻译中的双语字幕文件;
依次按条读取单语字幕文件中的字幕,将读取出的当前条字幕记为第一字幕,并从双语字幕文件中读取出与第一字幕的时间轴相差在预设时间范围内的所有字幕,记为字幕集合,所述字幕集合包括至少一条双语字幕;
将第一字幕与字幕集合进行比对;
基于比对结果,判断得到双语字幕相较于单语字幕的修改类型,并对字幕进行标记和修改处理;
其中,所述单语字幕文件中的字幕,每条字幕仅包括原文,所述双语字幕文件中的字幕,每条字幕包括原文和译文;
其中,所述判断得到双语字幕相较于单语字幕的修改类型,并对字幕进行标记和修改处理,具体为:
按行对字幕集合中的每条字幕进行拆分,得到多行字幕文本;
若满足第一规则,所述第一规则为第一字幕与拆分得到的任一行字幕文本内容相同,则表明单语字幕文件中对应第一字幕的字幕未发生修改,则提取双语字幕文件中对应第一字幕的字幕的译文,与第一字幕的时间轴和文本组成新的双语字幕;
若满足第二规则,所述第二规则为拆分得到的任一行字幕文本是第一字幕内容的前缀字符串,且字幕集合中与该行字幕文本所属字幕相邻的下一个字幕的任一行字幕文本是第一字幕内容的后缀字符串,则表明第一字幕为进行合并修改后得到的字幕,则提取双语字幕文件中对应第一字幕的两个字幕的译文,与第一字幕的时间轴和文本组成新的双语字幕;
若满足第三规则,所述第三规则为第一字幕内容是拆分得到的任一行字幕文本的前缀字符串,且单语字幕文件中与第一字幕相邻的下一个字幕的内容是拆分得到的任一行字幕文本的后缀字符串,则表明单语字幕文件中的这两条字幕为进行拆分修改后得到的字幕,则提取单语字幕文件中拆分修改后得到的两条字幕的时间轴和文本组成新的单语字幕,并对形成的新字幕进行标记;
若满足第四规则,所述第四规则为第一字幕内容与拆分得到的任一行字幕文本的相似度大于预设相似度,且该行字幕文本是拆分得到的所有行字幕文本中与第一字幕内容相似度最大的一行字幕文本,且不满足第一规则、第二规则、第三规则中的任何一个,则表明单语字幕文件中对应第一字幕的字幕发生修改,则提取双语字幕文件中对应第一字幕的字幕的译文,与第一字幕的时间轴和文本组成新的双语字幕,并对形成的新字幕进行标记,并对新字幕进行重新翻译;
若第一字幕与拆分得到的多行字幕进行比对,不满足第一规则、第二规则、第三规则、第四规则中的任何一个,则表明单语字幕文件中对应第一字幕的字幕为新增字幕,记为第五规则,则提取单语字幕文件中对应第一字幕的时间轴和文本组成新的单语字幕,并对形成的新字幕进行标记,并对新字幕进行重新翻译。
2.如权利要求1所述的一种单双语字幕修改查找处理方法,其特征在于,在依次读取单语字幕文件中的字幕之前,还包括:识别单语字幕文件中字幕是否为字幕类型,识别双语字幕文件中的字幕类型,所述字幕类型包括单语字幕和双语字幕。
3.如权利要求2所述的一种单双语字幕修改查找处理方法,其特征在于:所述识别单语字幕文件中字幕是否为字幕类型,具体包括以下步骤:
读取单语字幕文件中的每条字幕;
拼接读取的每条字幕的第一行,形成第一文本块;
拼接读取的每条字幕的最后一行,形成第二文本块;
判断第一文本块的语言代码与第二文本块的语言代码是否相同,若是,则单语字幕文件中的字幕为单语字幕,若否,则单语字幕文件中的字幕为双语字幕。
4.如权利要求2所述的一种单双语字幕修改查找处理方法,其特征在于:所述识别双语字幕文件中的字幕类型,具体包括以下步骤:
读取双语字幕文件中的每条字幕;
拼接读取的每条字幕的第一行,形成第三文本块;
拼接读取的每条字幕的最后一行,形成第四文本块;
判断第三文本块的语言代码与第四文本块的语言代码是否相同,若是,则双语字幕文件中的字幕为单语字幕,若否,则双语字幕文件中的字幕为双语字幕。
5.如权利要求1所述的一种单双语字幕修改查找处理方法,其特征在于:在将第一字幕与第二字幕进行比对之前,还包括:去除第一字幕与第二字幕的ass特效代码和行尾的标点符号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉译满天下科技有限公司,未经武汉译满天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010784084.8/1.html,转载请声明来源钻瓜专利网。