[发明专利]一种面向智能机器人的故事数据处理方法及系统有效
申请号: | 201810981546.8 | 申请日: | 2018-08-27 |
公开(公告)号: | CN109065019B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 贾志强 | 申请(专利权)人: | 北京光年无限科技有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/08;G10L13/10 |
代理公司: | 北京聿华联合知识产权代理有限公司 11611 | 代理人: | 朱绘;张文娟 |
地址: | 100000 北京市石景山区石景山*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 智能 机器人 故事 数据处理 方法 系统 | ||
本发明公开了一种面向智能机器人的故事数据处理方法以及系统。所述方法包括:获取故事文本数据;解析所述故事文本数据,识别故事文本中的对话以及旁白;调用故事数据处理模型,对所述故事文本中的对话以及旁白进行音效处理,生成带有音效的对话及旁白数据;生成并输出匹配所述故事文本的多模态数据,所述多模态数据包括所述带有音效的对话及旁白数据。相较于现有技术,根据本发明的方法及系统,可以将文本形式的故事转化为可多模态展现的多模态数据并对故事中的对话以及旁白的展现方式进行针对性优化,从而大大提高讲述故事时聆听者的用户体验。
技术领域
本发明涉及计算机领域,具体涉及一种面向智能机器人的故事数据处理方法及系统。
背景技术
在传统的人类日常生活中,文字阅读是人们鉴赏文学作品的主要途径。但是,在某些特定场景下,人们也通过声音鉴赏文学作品,例如,聆听评书、聆听朗诵等。其中最常见的,针对文字阅读能力不够的儿童,其通常是通过他人的讲述(听别人讲故事)来聆听文学作品。
随着多媒体技术的不断发展,越来越多的多媒体设备被应用于人类的日常生活当中。在多媒体技术的支持下,文学作品的声音形式的播放,尤其是讲故事,的主体逐渐转换到了多媒体设备上。
一般的,利用多媒体设备讲故事通常是事先人工讲故事并录制音频文件。多媒体设备只是播放录制好的音频文件。随着计算机技术的发展,为了简单方便的获取声源,在现有技术中,还采用了将文字数据转化为音频数据的方式。这样,就不需要人工进行文字朗诵并录音,只需要提供故事文本就可以实现利用多媒体设备讲故事。但是,利用计算机技术直接进行文本到语音的转换,只能保证文本内容的直接转换,其无法做到真人在故事讲述时的声情并茂,这就导致在现有技术中,基于文本转换技术的故事讲述十分干涩无趣,只能简单的传达直接的文字含义,用户体验很差。
发明内容
本发明提供了一种面向智能机器人的故事数据处理方法,所述方法包括:
获取故事文本数据;
解析所述故事文本数据,识别故事文本中的对话以及旁白;
调用故事数据处理模型,对所述故事文本中的对话以及旁白进行音效处理,生成带有音效的对话及旁白数据;
生成并输出匹配所述故事文本的多模态数据,所述多模态数据包括所述带有音效的对话及旁白数据。
在一实施例中,所述多模态数据还包括智能机器人动作数据,其中:
针对所述故事文本中的对话以及旁白生成对应的智能机器人动作数据。
在一实施例中,所述方法还包括:
结合所述带有音效的对话及旁白数据,对所述故事文本中的对话以及旁白进行文字语音转换,生成带有音效的对话及旁白语音数据;
将所述故事文本数据中除对话以及语音以外的文本转化为第一语音数据;
融合所述带有音效的对话及旁白语音数据以及所述第一语音数据,生成故事语音数据。
在一实施例中,调用故事数据处理模型,对所述故事文本中的对话以及旁白进行音效处理,包括:
对所述故事文本进行文本识别,基于文本识别结果对故事进行内容元素拆解,提取故事元素;
根据与所述对话以及旁白对应的故事元素确定匹配所述对话以及旁白的音效特征;
将所述对话以及旁白转化为匹配所述音效特征的所述带有音效的对话及旁白数据。
在一实施例中,与所述对话对应的故事元素包括对话角色、对话内容、对话环境和/或对话上下文指代。
在一实施例中,与所述旁白对应的故事元素包括旁白内容、旁白环境和/或旁白上下文指代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京光年无限科技有限公司,未经北京光年无限科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810981546.8/2.html,转载请声明来源钻瓜专利网。