[发明专利]角色标注方法、装置、电子设备和存储介质有效
申请号: | 202011098949.1 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112270167B | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 潘政林;白洁;王毅 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/30;G06F16/35;G06N20/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 角色 标注 方法 装置 电子设备 存储 介质 | ||
本申请公开了角色标注方法、装置、电子设备及存储介质,涉及深度学习等人工智能技术领域。具体实现方案为:获取待标注的对白语句以及对应的上下文信息,并对上下文信息和对白语句进行拼接,以得到拼接文本;从拼接文本中,抽取出与对白语句相对应的角色名称在拼接文本中的位置信息;根据位置信息,确定与对白语句相对应的第一候选角色名称;从拼接文本中出现过的角色名称中,确定与对白语句相对应的第二候选角色名称;根据第一候选角色名称和第二候选角色名称,确定与对白语句相对应的目标角色名称,并根据目标角色名称对对白语句进行角色标注。由此,通过自动化角色标注,能够提高标注效率,节省了人工标注成本和时间。
技术领域
本申请涉及计算机技术领域,具体涉及自然语言处理、深度学习等人工智能技术领域,尤其涉及一种角色标注方法、装置、电子设备及存储介质。
背景技术
当前市场主流的有声小说主要有两个产品形态:单角色和多角色。多角色有声小说又分为真人朗读和语音合成两种呈现形式,现有技术中,获取到文档文本后,通常需要标注人员通读全文,以便对文档文本中的对白语句进行标注,进而获知每句对白语句的角色名称。但是,采用人工标注角色对白的方式,导致耗时较长,标注成本较高,且效率低。因此,如何更好的实现对角色标注成为目前亟待解决的问题。
发明内容
本申请提供了一种角色标注方法、装置、电子设备以及存储介质。
根据本申请的第一方面,提供了一种角色标注方法,包括:
获取待标注的对白语句以及对应的上下文信息,并对所述上下文信息和所述对白语句进行拼接,以得到拼接文本;
从所述拼接文本中,抽取出与所述对白语句相对应的角色名称在所述拼接文本中的位置信息;
根据所述位置信息,确定与所述对白语句相对应的第一候选角色名称;
从所述拼接文本中出现过的角色名称中,确定与所述对白语句相对应的第二候选角色名称;
根据所述第一候选角色名称和所述第二候选角色名称,确定与所述对白语句相对应的目标角色名称,并根据所述目标角色名称对所述对白语句进行角色标注。
根据本申请的第二方面,提供了一种角色标注装置,包括:
第一获取模块,用于获取待标注的对白语句以及对应的上下文信息,并对所述上下文信息和所述对白语句进行拼接,以得到拼接文本;
第二获取模块,用于从所述拼接文本中,抽取出与所述对白语句相对应的角色名称在所述拼接文本中的位置信息;
第一确定模块,用于根据所述位置信息,确定与所述对白语句相对应的第一候选角色名称;
第二确定模块,用于从所述拼接文本中出现过的角色名称中,确定与所述对白语句相对应的第二候选角色名称;
第一执行模块,用于根据所述第一候选角色名称和所述第二候选角色名称,确定与所述对白语句相对应的目标角色名称,并根据所述目标角色名称对所述对白语句进行角色标注。
根据本申请的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请的第一方面所述的角色标注方法。
根据本申请的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请第一方面所述的角色标注方法。
根据本申请的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本申请第一方面所述的角色标注方法。
本申请提供的实施例,至少具有如下有益技术效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011098949.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光纤手机快转头的加工工艺
- 下一篇:一种节能型热能表数据采集装置