[发明专利]一种影视剧本场景信息的提取方法有效
申请号: | 201711202819.6 | 申请日: | 2017-11-27 |
公开(公告)号: | CN107977359B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 柏昆 | 申请(专利权)人: | 西安影视数据评估中心有限公司 |
主分类号: | G06F40/263 | 分类号: | G06F40/263;G06F16/36 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 韩晓娟 |
地址: | 710071 陕西省西安市曲江新区翠*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种影视剧本场景信息的提取方法,涉及软件开发技术领域,通过逐行读取影视剧本内容,自动识别出具有场景描述的影视剧本内容行,再利用基于词典匹配的方式,准确提取场景信息中的场次、地点、内外场描述、时间、天气、主要人物等基本信息。使用本发明的方法可解决影视剧本评估的场景分析时,人工识别准确度不高,浪费时间的问题,可快速准确识别和提取场景中的基本信息,提高影视剧本评估中场景分析的质量和速度。 | ||
搜索关键词: | 一种 影视 剧本 场景 信息 提取 方法 | ||
【主权项】:
一种影视剧本场景信息的提取方法,其特征在于,该方法包括以下步骤:步骤1,建立内外、时间、天气场景描述的基本信息词典;步骤2,读取完整的影视剧本,删除空白行,去除每行内容的前后空格字符,基于处理后的影视剧本内容进行场景内容识别和提取;步骤3,读取影视剧本前500个字符,判断影视剧本场景描述采用单行描述方式还是三行描述方式,如果影视剧本内容中连续三行出现的第一个汉字是景、时、人三个汉字之一,且景、时、人三个汉字都出现一次的情况下,场景的描述方式为三行描述方式,不是三行描述方式即为单行描述方式;步骤4,初始化影视剧本行读取序号N,设置N=1,初始化一个空列表L,用于按先后顺序存放已识别的场景信息;步骤5,判断N是否超过影视剧本总行数,如果是则执行步骤9,否则读取影视剧本第N行内容,即为字符串S;步骤6,判断字符串S第一个字符是否为中英文数字字符,如果是则该行可能是场景描述,执行步骤7,否则执行步骤8;步骤7,根据步骤3获取的场景描述方式,采用不同的场景信息识别和提取方法;步骤8,根据步骤6、步骤7中判断结果,设置下一行读取影视剧本位置;步骤9,列表L即为从影视剧本中识别和提取出的全部场景信息,将列表L存储到文件、数据库中,识别和提取场景信息处理完成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安影视数据评估中心有限公司,未经西安影视数据评估中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711202819.6/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置