[发明专利]信息处理设备和方法以及计算机可读存储介质在审
申请号: | 201910560709.X | 申请日: | 2019-06-26 |
公开(公告)号: | CN112233647A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 刘毅 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L15/26;A63F13/424 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李彦丽 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 设备 方法 以及 计算机 可读 存储 介质 | ||
1.一种信息处理设备,包括:
处理电路,被配置为:
从声音中选择出与发出所述声音期间的场景特征相关的声音元素;
建立对应关系,所述对应关系包括所述场景特征与所述声音元素之间以及各个声音元素之间的第一对应关系,并且将所述场景特征和所述声音元素以及所述对应关系相关联地存储在对应关系库中;以及
基于再现场景特征和所述对应关系库,生成待再现的声音。
2.根据权利要求1所述的信息处理设备,其中,
所述对应关系还包括所述声音与所述场景特征和所述声音元素之间的第二对应关系;以及
所述处理电路被配置为:
将所述声音与所述场景特征和所述声音元素以及所述第二对应关系相关联地存储在所述对应关系库中,以及
根据所述对应关系从所述对应关系库中查找与所述再现场景特征相关的声音或声音元素,并且利用所查找到的声音或声音元素生成所述待再现的声音。
3.根据权利要求2所述的信息处理设备,其中,所述处理电路被配置为:
在所述再现场景特征与所述对应关系库中的场景特征完全匹配的情况下,查找与所述再现场景特征完全匹配的场景特征相关的声音,并且利用所查找到的声音生成所述待再现的声音。
4.根据权利要求3所述的信息处理设备,其中,
所述声音为讲话者的语音,以及
所述处理电路被配置为:
将所查找到的声音以文本或音频的形式加入到原始讲话者的声音信息库中,并且基于所述声音信息库生成所述待再现的声音,以供按照所述原始讲话者的发音声线来渲染所述待再现的声音;或者
利用文本或音频的形式的所查找到的声音生成所述待再现的声音,以供按照说出所查找到的声音的讲话者的发音声线来渲染所述待再现的声音。
5.根据权利要求2所述的信息处理设备,其中,所述处理电路被配置为:
在所述再现场景特征与所述对应关系库中的场景特征均不完全匹配的情况下,查找与所述再现场景特征的各部分分别匹配的场景特征相关的声音元素,并通过组合所查找到的声音元素来生成所述待再现的声音。
6.根据权利要求5所述的信息处理设备,其中,
所述声音为讲话者的语音,以及
所述处理电路被配置为:
将所查找到的声音元素以文本或音频的形式加入到原始讲话者的声音信息库中,并且基于所述声音信息库生成所述待再现的声音,以供按照所述原始讲话者的发音声线来渲染所述待再现的声音;或者
利用所查找到的声音元素生成所述待再现的声音,以供按照说出所查找到的声音元素的讲话者的发音声线来渲染所述待再现的声音。
7.根据权利要求1至6中任一项所述的信息处理设备,其中,
所述处理电路被配置为经由分别与每个讲话者对应设置的声音采集器件来收集每个讲话者的声音,并且根据声音采集器件的ID来区分收集到的不同讲话者的声音;和/或,所述处理电路被配置为经由一个声音采集器件来集中收集每个讲话者的声音,并且根据讲话者的位置信息和/或声线信息来区分收集到的不同讲话者的声音。
8.一种信息处理方法,包括:
从声音中选择出与发出所述声音期间的场景特征相关的声音元素;
建立对应关系,所述对应关系包括所述场景特征与所述声音元素之间以及各个声音元素之间的第一对应关系,并且将所述场景特征和所述声音元素以及所述对应关系相关联地存储在对应关系库中;以及
基于再现场景特征和所述对应关系库,生成待再现的声音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910560709.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机器人避障方法和装置
- 下一篇:液滴型缺陷的检测方法和检测系统