[实用新型]一种基于串行存储器构建的语音合成芯片有效
申请号: | 201220151494.X | 申请日: | 2012-04-11 |
公开(公告)号: | CN202502734U | 公开(公告)日: | 2012-10-24 |
发明(设计)人: | 何宇新;何娅玲 | 申请(专利权)人: | 北京宇音天下科技有限公司 |
主分类号: | G10L13/00 | 分类号: | G10L13/00 |
代理公司: | 北京君智知识产权代理事务所 11305 | 代理人: | 刘秀娟 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 串行 存储器 构建 语音 合成 芯片 | ||
【技术领域】
本实用新型涉及通讯数据领域。具体地,本实用新型涉及一种基于串行存储器构建的语音合成芯片及其框架。
【背景技术】
语音芯片是将语音信号通过采样转化为数字信号,存储在芯片的存储器中,再通过数/模转换电路和解码器等硬件,将存储器中的数字信号还原成语音信号的设备。
语音合成芯片则是通过接收上位机(主控MCU)发送的文本字符信息,通过TTS(Text To Speech,从文本到语音)技术形成合成语音,并驱动芯片外围的发声器,实现文本内容的直接发声。当前主流的语音合成芯片,一般思路是采用SoC(System On Chip,片上系统)的方法,在一颗裸片上集成CPU、RAM、ROM、FLASH等计算存储资源,以及UART、SPI、USB、功放等许多外围通信接口资源,并在ROM/FLASH资源中固化存放TTS语音合成软件代码和语音特征数据,然后进行裸片封装。这样的设计导致在一颗裸片上需要集成多种不同的制程工艺,直接造成芯片设计、生产十分复杂,即使设计成功,也由于成本太高,性/价比不好而难以推广。
此外,对于智能化程度高(听感自然)的语音合成软件,例如基于统计声学模型的HMM语音合成技术,如果要内嵌到语音合成芯片中,需要芯片中内置大容量的数据ROM存储或FLASH存储,存储规模至少需要2M字节,同时还需要内置高速计算的CPU核和足够的内存缓冲区。这些硬件需求导致在SoC的芯片上实现智能化程度高的语音合成技术,必须采用多种完全不同的芯片制程工艺,导致芯片加工制作难度很大。
而采用智能化水平较低的语音合成技术,包括早期的基于语音波形拼接为主体的PSOLA技术,虽然可以使得芯片对CPU计算资源和RAM、ROM的存储资源要求控制在一个受限的水平,但合成的语音效果带有浓重的机器味;此外还有韵律不自然,可懂度差等许多比较负面的受众听感。
CN201936600U公开了一种基于专用语音芯片,进行非特定人语音识别与语音合成装置,它采用嵌入式处理器外围扩展专用语音处理芯片(包括语音识别芯片、和语音合成芯片)的方式,实现了语音识别与语音合成。它包括对话管理模块,该模块与语音输入模块、外部设备接口模块、显示模块、语音合成模块和语音输出模块连接;电源模块为整个装置供电。对话管理模块由以STM32为核心的主控制电路和以24C256为核心的扩展存储器电路组成;电源模块进行了模拟电源与数字电源的隔离;语音输入模块以LD3320专用非特定人语音识别芯片为核心,实现语音识别,并将识别结果反馈给主控制器;语音合成模块以XFS4041CN专用语音合成芯片为核心,实现语音合成;另外,设计了外部串行设备接口单元和LCD液晶屏接口,便于装置的初始化和外部设备的连接。
上述装置通过使用模块化的方法,将专用语音合成芯片和语音识别芯片,简单的集成在一块PCB电路板上,实现语音识别和合成的功能,也是现有较为常见的一类实现语音识别和合成的专用装置,但作为专用装置,其适用性大受限制,无法实现其功能在多种场合下的应用,其设备体积也很大,通常是语音合成芯片的几十倍以上的大小,同时本专用装置工作时功耗的问题也无法忽略。
【实用新型内容】
本实用新型的目的是克服现有技术缺陷,提供一种能够实现高智能化语音合成技术、结构更简单、无需在同一芯片上集用多种制程工艺的语音合成芯片,其制造工艺可以充分利用当今芯片制造的先进流程,具有更成熟的支撑手段和设计方法,并具有良好的、在未来构建各类型的专用语音处理装置中的适用性。
因此,本实用新型提供一种基于串行存储器(比如:SPI-FLASH),将语音合成芯片划分成两个功能子芯片:语音信号处理子芯片和串行存储子芯片,这两类子芯片通过绝缘胶或高密度粘性薄膜等多芯片粘接工艺,和多芯片堆叠封装MCP(Multi Chip Package)工艺进行系统封装,最终形成新型的语音合成芯片,由此可以内嵌智能化程度很高的语音合成软件,使得芯片的合成语音自然度高、合成效果,及最终的性/价比均具有很大的提升。
具体地,本实用新型提供一种基于串行存储器构建的语音合成芯片,所述语音合成芯片包括语音信号处理子芯片和用于保存语音模型和字典数据的串行存储子芯片,其中,所述语音信号处理子芯片和串行存储子芯片通过多芯片堆叠方式封装在一起,获得QFP/LQFP的封装形式;所述语音合成芯片的引线数不超过64个,面积不大于10mm×10mm。
优选地,所述语音信号处理子芯片和串行存储子芯片通过绝缘粘胶或粘膜粘结在一起。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京宇音天下科技有限公司,未经北京宇音天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201220151494.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:水溶性切削液
- 下一篇:一种高润滑抗菌切削液及其制备方法