[发明专利]一种影视剧本场景信息的提取方法有效
申请号: | 201711202819.6 | 申请日: | 2017-11-27 |
公开(公告)号: | CN107977359B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 柏昆 | 申请(专利权)人: | 西安影视数据评估中心有限公司 |
主分类号: | G06F40/263 | 分类号: | G06F40/263;G06F16/36 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 韩晓娟 |
地址: | 710071 陕西省西安市曲江新区翠*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 影视 剧本 场景 信息 提取 方法 | ||
本发明公开了一种影视剧本场景信息的提取方法,涉及软件开发技术领域,通过逐行读取影视剧本内容,自动识别出具有场景描述的影视剧本内容行,再利用基于词典匹配的方式,准确提取场景信息中的场次、地点、内外场描述、时间、天气、主要人物等基本信息。使用本发明的方法可解决影视剧本评估的场景分析时,人工识别准确度不高,浪费时间的问题,可快速准确识别和提取场景中的基本信息,提高影视剧本评估中场景分析的质量和速度。
技术领域
本发明涉及软件开发技术领域,特别是涉及一种影视剧本场景信息的提取方法。
背景技术
影视剧本的分析评估中涉及到对场景信息进行分析,场景信息分散在影视剧本内容中,在一行或三行中进行描述。场景信息一般包括场次、地点、内外场描述、时间、天气、主要人物等基本信息。
影视剧本的分析评估中对场景信息的分析主要由人工识别和分析为主,存在以下的困难:
a.一般电视剧每集30-50个场景,整部电影约150个场景,受电视剧,电影的类型,时长,情节等因素因素,场景数可能更多或更少,分析时人工计数消耗时间。
b.场景信息中包含的基本信息先后顺序不固定,基本信息之间可能通过逗号,顿号,句号,冒号,TAB制表符等分隔,没有标准的格式。
c.编剧在编写影视剧本时,可能由于修改或其他原因导致,场景信息中的场次不连续或重复,这给场景的统计分析带来一定的困难。
发明内容
本发明实施例提供了一种影视剧本场景信息的提取方法,可以解决现有技术中存在的问题。
本发明提供了一种影视剧本场景信息的提取方法,该方法包括以下步骤:
步骤1,建立内外、时间、天气场景描述的基本信息词典;
步骤2,读取完整的影视剧本,删除空白行,去除每行内容的前后空格字符,基于处理后的影视剧本内容进行场景内容识别和提取;
步骤3,读取影视剧本前500个字符,判断影视剧本场景描述采用单行描述方式还是三行描述方式,如果影视剧本内容中连续三行出现的第一个汉字是景、时、人三个汉字之一,且景、时、人三个汉字都出现一次的情况下,场景的描述方式为三行描述方式,不是三行描述方式即为单行描述方式;
步骤4,初始化影视剧本行读取序号N,设置N=1,初始化一个空列表L,用于按先后顺序存放已识别的场景信息;
步骤5,判断N是否超过影视剧本总行数,如果是则执行步骤9,否则读取影视剧本第N行内容,即为字符串S;
步骤6,判断字符串S第一个字符是否为中英文数字字符,如果是则该行可能是场景描述,执行步骤7,否则执行步骤8;
步骤7,根据步骤3获取的场景描述方式,采用不同的场景信息识别和提取方法;
步骤8,根据步骤6、步骤7中判断结果,设置下一行读取影视剧本位置;
步骤9,列表L即为从影视剧本中识别和提取出的全部场景信息,将列表L存储到文件、数据库中,识别和提取场景信息处理完成。
本发明实施例中的一种影视剧本场景信息的提取方法,通过逐行读取影视剧本内容,自动识别出具有场景描述的影视剧本内容行,再利用基于词典匹配的方式,准确提取场景信息中的场次、地点、内外场描述、时间、天气、主要人物等基本信息,并达到以下效果:
a.自动识别影视剧本中场景描述。
b.准确提取场景信息中的基本信息。
c.节约影视剧本场景分析时间,提高场景分析效率和准确性。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安影视数据评估中心有限公司,未经西安影视数据评估中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711202819.6/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置