[发明专利]用于校正字幕文本中的错误的系统和方法在审
申请号: | 201680090655.X | 申请日: | 2016-09-30 |
公开(公告)号: | CN110235449A | 公开(公告)日: | 2019-09-13 |
发明(设计)人: | A·K·古普塔;A·S·萨瓦尔卡尔 | 申请(专利权)人: | 乐威指南公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N7/088 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 郭思宇 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 校正 文本片段 字幕文本 上下文术语 媒体资产 视频帧 屏幕 常规系统 方法描述 方法识别 识别候选 知识图 替换 访问 | ||
1.一种用于校正针对媒体资产的屏幕上字幕文本中的错误术语的方法,包括:
识别屏幕上字幕文本的文本片段中的错误术语;
识别与所述文本片段对应的所述媒体资产的一个或多个视频帧;
从所述一个或多个视频帧中识别与所述错误术语相关的上下文术语;
访问知识图,以基于所述上下文术语和所述文本片段的一部分来识别候选校正;以及
用所述候选校正替换所述错误术语。
2.一种用于校正媒体资产的屏幕上字幕文本中的错误术语的方法,包括:
分析媒体资产的音频流,以确定屏幕上字幕文本的第一文本片段;
识别所述屏幕上字幕文本的第一文本片段中的错误术语;
从与所述第一文本片段对应的所述媒体资产的视频流中提取一个或多个视频帧;
分析所述一个或多个视频帧中的第一视频帧,以确定与所述错误术语相关联的上下文术语;
访问知识图,以基于所述上下文术语和所述第一文本片段的一部分来识别所述错误术语的候选校正;以及
用所述候选校正替换隐藏字幕文本的所述第一文本片段中的所述错误术语。
3.如权利要求2所述的方法,其中识别所述第一文本片段中的错误术语还包括对所述第一文本片段执行自然语言处理,以将所述第一文本片段与多个语法规则进行比较。
4.如权利要求2所述的方法,其中所述屏幕上字幕文本的第一文本片段是带时间戳的,并且其中所述第一视频帧是在媒体资产的与所述错误术语在带时间戳的第一文本片段中的位置对应的位置处提取的。
5.如权利要求2所述的方法,其中访问知识图以基于所述上下文术语和所述第一文本片段的一部分识别候选校正还包括:
从所述第一文本片段的所述部分中提取关键词;
在知识图中搜索与所述上下文术语和所述关键词对应的节点;
分析所述节点以查找与所述上下文术语和所述关键词相关联的特性;以及
基于与所述上下文术语和所述关键词相关联的特性来确定至少一个其它节点,其中所述至少一个其它节点与候选校正相对应。
6.如权利要求2所述的方法,还包括:
识别所述屏幕上字幕文本的第二文本片段中的错误术语;
分析与所述第二文本片段对应的第二视频帧,以确定与所述错误术语相关联的第二上下文术语;
访问知识图,以基于所述第一上下文术语、所述第二上下文术语、所述第一文本片段的一部分和所述第二文本片段的一部分来识别更新的候选校正;以及
用所述更新的候选校正来替换所述屏幕上字幕文本的所述第二文本片段中的所述错误术语。
7.如权利要求6所述的方法,还包括用所述更新的候选校正替换所述第一文本片段中的候选校正。
8.如权利要求2所述的方法,其中访问知识图以识别所述错误术语的候选校正还包括:
从知识图确定所述错误术语的多个潜在校正;
基于所述确定,为所述多个潜在校正中的每个潜在校正指派权重;以及
识别与最高权重相关联的潜在校正作为候选校正。
9.如权利要求8所述的方法,其中为所述多个潜在校正中更新近的潜在校正指派更高的权重。
10.如权利要求8所述的方法,还包括:
基于语音算法确定潜在候选校正与所述错误术语之间的语音相似性得分;以及
为具有更高语音相似性得分的潜在候选校正指派更高的权重。
11.如权利要求2所述的方法,其中访问知识图以基于所述上下文术语和所述第一文本片段的一部分来识别候选校正还包括更新知识图的现有节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐威指南公司,未经乐威指南公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680090655.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理装置和方法
- 下一篇:音响装置和音响控制装置