[发明专利]一种导航系统用户语音自定义方法无效
申请号: | 201210554526.5 | 申请日: | 2012-12-14 |
公开(公告)号: | CN103093753A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 徐小光;张璐;迟丽丽;谢振江;徐良;李峰 | 申请(专利权)人: | 沈阳美行科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G01C21/36 |
代理公司: | 沈阳晨创科技专利代理有限责任公司 21001 | 代理人: | 任玉龙 |
地址: | 110004 辽宁省沈阳*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 导航系统 用户 语音 自定义 方法 | ||
技术领域
本发明涉及导航系统领域,特别涉及了一种导航系统用户语音自定义方法。
背景技术
随着城市道路网络的日益复杂和车辆日益增多,汽车导航系统已经得到了广泛的应用。使得驾驶员在复杂的路况下依然能够自由驾驶。汽车导航系统属于典型的嵌入式设备,受到体积,成本,功耗和应用场合的限制。
随着嵌入式技术的发展,汽车导航系统朝着智能化,人性化发展。实时语音引导功能已经广泛的应用在导航终端。用户可以实时获得引导语音提示,在驾驶过程中不用查看地图的条件下就能方便的获得更多的地图提示信息。语音引导使人机交互更加人性化,同时也保证了驾驶的安全性。
传统汽车导航系统语音提示采用内置TTS发声引擎,通过计算机合成出接近自然声音的语音信号输出到发声设备。其结构框架如下:
TTS语音合成过程包括在文本分析处理模块进行文本解析,词语切分,语法分析,语意分析和韵律处理。接下来交给语音合成模块进行语音合成,最终输出PCM编码语音信号,传入Codec芯片进行D/A转换,通过音响功放电路推动扬声器发出接近自然声音的语音。
传统的TTS发音虽然应用广泛,但是发音前需要合成,会导致响应速度变慢。为了提高响应速度,目前在导航系统采取了一些优化措施,包括预读取字符串和语音库,声音缓存等方式,提高了语音实时播报的速度。但是由于语音库是内置在系统中,用户并不能直接对其进行定制。当用户不满意播报效果时,不能单独针对某一条提示语音进行修改。现有导航系统会在引导过程中,给用户比较详尽道路信息的语音提示,导航系统通过TTS引擎合成语音,语音库由于在导航出厂前内置在系统中,用户并不能自由替换提示语音。
发明内容
本发明的目的是为了能把用户预先自己录制好的语音加入到汽车导航的语音提示系统内,使在导航系统能够选择使用自定义的语音来进行提示,特提供了一种导航系统用户语音自定义方法。
本发明提供了一种导航系统用户语音自定义方法,其特征在于:所述的导航系统用户语音自定义方法硬件涉及定位模块、算路模块、引导模块、TTS语音合成模块、解码模块;
定位模块,在汽车行驶过程中,通过硬件的GPS模块获取到位置信息;其中通信多数采用NMEA-0183协议,报文中包含定位所需要的坐标信息;模块需要先解析报文,获取位置坐标后再经过地图匹配算法进行轨迹纠偏,最后获取较精确的位置坐标;
算路模块,提供了为从出发地到目的地为车辆寻找到驾驶时间最短的路线的功能;电子地图保存了矢量化的道路网络信息;道路网可以看作权值为正值的有向图;算路模基于dijkstra算法在有向图中搜索最短路径;一个有权重的有向图G,以及G中的一个来源顶点S中,以V表示G中所有顶点的集合;Dijkstra算法可以在一个图中,找到从一个顶点s到任何其他顶点的最短路径;
引导模块,在驾驶过程中用户可能会遇到限速,转弯等情况;引导模块就是在就算好的路线上,对用户进行提示;在地图数据中,保存了引导信息;当车辆行驶到带有引导信息的坐标时,会触发语音提示;引导模块把引导信息转换成提示字符串;比如“前方300米左转,然后直行”;
TTS语音合成模块,把引导模块生成的提示字符串通过语言学处理,韵律处理和声学处理合成为语音信号;
解码模块,作为数字信号的提示语音,以PCM编码形式进行储存;解码模块就是把语音编码进行处理,然后进行D/A转换,推动音响设备进行发音;
用户自定义语音的实现基础:
TTS语音合成引擎合成语音过程比较复杂,从而导致消耗过多的CPU资源;另外合成语音需要较长时间,会导致语音播报延时;通过优化,采用语音缓存的方式来解决这一问题;在进行引导过程中,90%的提示语音是经常出现的,这样可以把语音缓存起来;语音缓存文件是由字符串索引和语音数据组成;
引导模块生成缓存中有的字符串时,可以直接播放缓存中已有的声音;这样避免了采用TTS语音合成模块生成语音的复杂过程,加快了语音实时播报的速度,也降低了系统资源的损耗;其流程如下图2所示;
在语音合成之前,系统会用引导信息的字符串和缓存中的每一条字符串索引进行比较,如果一致,命中缓存,则直接播放缓存中的语音,如果不一致,则利用TTS语音合成系统先合成语音,再进行播放;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳美行科技有限公司,未经沈阳美行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210554526.5/2.html,转载请声明来源钻瓜专利网。