[发明专利]一种面向智能机器人的故事数据处理方法及系统有效
申请号: | 201811442507.7 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109543021B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 贾志强;俞晓君 | 申请(专利权)人: | 北京光年无限科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36 |
代理公司: | 北京聿华联合知识产权代理有限公司 11611 | 代理人: | 张文娟;朱绘 |
地址: | 100000 北京市石景山区石景山*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 智能 机器人 故事 数据处理 方法 系统 | ||
本发明公开了一种面向智能机器人的故事数据处理方法以及系统。所述方法包括:获取故事文本数据;解析所述故事文本数据,识别故事文本中的角色;针对识别出的不同的角色调用对应的角色音效数据;调用故事数据处理模型,基于所述角色音效数据对所述故事文本中与所述角色相关的故事文本进行音效处理,生成带有角色音效的故事语音数据;生成并输出匹配所述故事文本的多模态数据,所述多模态数据包括所述带有角色音效的故事语音数据。相较于现有技术,根据本发明的方法及系统,可以将文本形式的故事转化为可多模态展现的多模态数据并根据故事中出现的角色对相关文本进行针对性优化,从而大大提高讲述故事时聆听者的用户体验。
技术领域
本发明涉及计算机领域,具体涉及一种面向智能机器人的故事数据处理方法及系统。
背景技术
在传统的人类日常生活中,文字阅读是人们鉴赏文学作品的主要途径。但是,在某些特定场景下,人们也通过声音鉴赏文学作品,例如,聆听评书、聆听朗诵等。其中最常见的,针对文字阅读能力不够的儿童,其通常是通过他人的讲述(听别人讲故事)来聆听文学作品。
随着多媒体技术的不断发展,越来越多的多媒体设备被应用于人类的日常生活当中。在多媒体技术的支持下,文学作品的声音形式的播放,尤其是讲故事,的主体逐渐转换到了多媒体设备上。
一般的,利用多媒体设备讲故事通常是事先人工讲故事并录制音频文件。多媒体设备只是播放录制好的音频文件。随着计算机技术的发展,为了简单方便的获取声源,在现有技术中,还采用了将文字数据转化为音频数据的方式。这样,就不需要人工进行文字朗诵并录音,只需要提供故事文本就可以实现利用多媒体设备讲故事。但是,利用计算机技术直接进行文本到语音的转换,只能保证文本内容的直接转换,其无法做到真人在故事讲述时的声情并茂,这就导致在现有技术中,基于文本转换技术的故事讲述十分干涩无趣,只能简单的传达直接的文字含义,用户体验很差。
发明内容
本发明提供了一种面向智能机器人的故事数据处理方法,所述方法包括:
获取故事文本数据;
解析所述故事文本数据,识别故事文本中的角色;
针对识别出的不同的角色调用对应的角色音效数据;
调用故事数据处理模型,基于所述角色音效数据对所述故事文本中与所述角色相关的故事文本进行音效处理,生成带有角色音效的故事语音数据;
生成并输出匹配所述故事文本的多模态数据,所述多模态数据包括所述带有角色音效的故事语音数据。
在一实施例中,解析所述故事文本数据,包括:
对所述故事文本数据进行预处理,所述预处理包括大小写统一转换、全角/半角转换和/或同义词替换;
针对预处理结果进行分句处理;
针对分句处理结果进行基础语义识别,包括分词、词性、中文命名实体和/或句法识别;
基于基础语义识别结果识别角色。
在一实施例中,解析所述故事文本数据,还包括:
针对中文命名实体识别未识别的实体,调用新词发现模型进行识别。
在一实施例中,识别故事文本中的角色,包括:
识别所述故事文本数据中的指代词;
利用上下文识别所述指代词对应的角色。
在一实施例中,识别故事文本中的角色,包括:
区分所述故事文本数据中的旁白和对话;
从所述旁白中根据基础语义识别结果来识别角色。
在一实施例中,识别故事文本中的角色,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京光年无限科技有限公司,未经北京光年无限科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811442507.7/2.html,转载请声明来源钻瓜专利网。