[发明专利]电子装置及其控制方法有效
申请号: | 201880066283.6 | 申请日: | 2018-07-19 |
公开(公告)号: | CN111201569B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 朱基岘;A.波洛夫;郑钟勋;成昊相;吴殷美;柳宗烨 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/02;G10L25/30;G10L19/26 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王新宇 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 装置 及其 控制 方法 | ||
本文公开了一种电子装置。所述电子装置包括:存储器,其用于存储分别在多个卷积神经网络(CNN)中训练的多个滤波器;以及处理器,其配置成获取对应于受损音频信号的第一频谱图,将所述第一频谱图输入到对应于每个频带的CNN,以分别应用在所述多个CNN中训练的所述多个滤波器,通过合并其中应用了所述多个滤波器的所述CNN的输出值来获取第二频谱图,以及获取基于所述第二频谱图重构的音频信号。
技术领域
本公开涉及一种电子装置及其控制方法,并且更具体地,涉及一种能够重构音频的声音质量的电子装置及其控制方法。
背景技术
人工智能(AI)系统是一种实现人类级别智能的计算机系统,更是一种机器学习、判断和变得智能的系统,并且不同于现有的基于规则的智能系统。随着人工智能系统使用的改进,可以更准确地执行识别率和对用户喜好的理解或预测。如此,现有的基于规则的智能系统正在被基于深度学习的AI系统代替。
AI技术包括机器学习(例如,深度学习)和利用机器学习的基本技术。
机器学习是能够分类或学习输入数据特征的算法技术。元素技术(elementtechnology)是使用机器学习算法(诸如深度学习)的技术。机器学习由诸如语言理解、视觉理解、推理、预测、知识表示、运动控制等技术领域组成。
其中应用人工智能技术的各个领域如下所示。语言理解是用于识别、应用和/或处理人类的语言或字符的技术,并且包括自然语言处理、机器翻译、对话系统、查询和应答、语音识别或合成等等。视觉理解是用于如人类视觉一样识别和处理对象的技术,包括对象识别、对象跟踪、图像搜索、人类识别、场景理解、空间理解、图像改进等等。推断预测是用于判断以及逻辑推断和预测信息的技术,包括基于知识和基于概率的推断、优化预测、基于偏好的计划、推荐等等。知识表示是用于将人类经验信息自动化为知识数据的技术,包括知识构建(数据生成或分类)、知识管理(数据利用)等等。运动控制是用于控制车辆的自主运行和机器人的运动的技术,包括运动控制(导航、碰撞、驾驶)、操作控制(行为控制)等等。
随着硬件技术和计算机能力的发展使得大数据收集和存储成为可能,并且用于对其进行分析的技术变得更加智能并加速发展,近来已经对机器学习进行了积极的研究,机器学习是一种能够像人一样识别对象并理解信息的算法。特别地,在机器学习技术领域,已经使用神经网络对自主学习方案中的深度学习进行了积极的研究。
神经网络是一种算法,其用于通过将激活函数与通过将多个输入乘以权重获得的和的特定边界值进行比较来确定最终输出,此算法基于积极模仿人脑功能的意图并且通常由多个层构成。代表性示例包括广泛用于图像识别的卷积神经网络(CNN)、广泛用于语音识别的递归神经网络(RNN)等。
本公开提供了一种使用神经网络学习音频数据并重构受损音频数据的方法。当压缩或传输音频信号时,为了实现有效压缩或传输,某些频带的音频信号可能会丢失。与丢失之前的音频信号相比,其中丢失了某个频带中的数据的音频信号可能已经降低了音质或改变了音调。
汽车是其中主要消费音乐的典型场所,但是由于压缩/降级声源的广泛使用,用户不得不收听音质普遍降级的音乐。
因此,如果要将包括丢失频带的音频信号重现为接近具有高音质的原始声音,则需要有效地重构丢失频带中的音频信号。
发明内容
技术问题
本公开提供了一种电子装置及其控制方法,其中在该电子装置中执行有效的重构,使得用户即使在压缩或降级的声源中也可以享受高质量的声音。
技术方案
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880066283.6/2.html,转载请声明来源钻瓜专利网。