[发明专利]基于IOS交互式语音播报系统在审
申请号: | 201710011510.2 | 申请日: | 2017-01-07 |
公开(公告)号: | CN108289142A | 公开(公告)日: | 2018-07-17 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 长沙湘佩网络技术有限公司 |
主分类号: | H04M1/725 | 分类号: | H04M1/725 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410011 湖南省长沙市芙蓉区*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交互式语音 文件管理 语音识别 播报 语音交互功能 播放功能 技术采用 录播系统 录音功能 声音处理 系统功能 系统核心 语音交换 录音 播放 | ||
基于IOS交互式语音播报系统,设计并实现了基于IOS平台交互式语音录播系统;本系统核心技术采用声音处理包和语音识别包,系统功能分为录音功能、播放功能、语音交换功能和文件管理四个方面设计;本系统具有录音、播放、文件管理、语音识别和语音交互功能。
技术领域
本发明使用Objective-C技术,特别涉及IOS平台上的声音和语音识别技术。
背景技术
录音软件是iPhone和iPad移动设备必备的工具,给工作、学习和生活带来了很大的便利;IOS系统自带的录音机软件是一款操作简单、高质量的软件,具有高音质的录音文件输出和良好的用户体验;但是,系统自带的录音软件的功能也相对较少;同样苹果商店的其他录音软件一般只是实现录音、播放、文件的存储和文件的管理;有的功能强的录音软件还具有录音文件的编辑、网络分享等功能。
发明内容
系统应用核心技术:
1.声音处理包:在IOS应用开发中,播放音频主要采用AudioToolbox.framework和AVFoundation.framework;前者主要用于短音频的播放,通常用于一些特效音频播放,对于这类音频不需要进行进度、循环等控制;后者常用于播放一些较长的音频,对于这些音频的播放通常需要进行精确的控制;所以,本系统录音机功能的实现使用的是AV Foundation框架;
录音机应用程序使用了AV Foundation框架中的AVAudio Recorder实现录音功能;使用框架中的AVAudioPlayer来实现播放功能;AVAudioPlayer可以看成一个播放器,它支持多种音频格式,而且能够进行进度、音量、播放速度等控制;AVAudioPlayer一次只能播放一个音频文件,本系统中多个音频的播放是通过创建多个播放器对象来完成;要用这两个类,需要添加头文件:#import <AVFoundation/AVFoundation.h>;
2.语音识别包:关于语音识别功能的核心技术可以采用第三方开发包;诸如此类的语音识别包有很多,本系统采用的是讯飞语音识别开发包;使用这SDK需要做如下事情:
1)到讯飞官方网站的开发者专区(http://open.voicecloud.cn/developer.php)先注册一个开发者账号;
2)登陆之后到自己的个人中心创建一个应用,填写好相关信息,然后等待审核通过;
3)应用审核通过后,选择对应平台的SDK下载;
4)解压下载的压缩包,从包中选择部分framework添加到工程中,具体在BuildingPhases Link Binary With Libraries中设置;如果使用了离线识别,需要增加libc++.dylib。
系统功能设计:
1.录音功能:主要功能是当用户按下“开始录音”按钮时,系统设置录音的参数并开始录音;当松开按钮,则录音结束,并将以当前的系统时间命名录音文件后再进行本地化存储,同时显示到列表视图中供用户查看和编辑;录制时,有进度条控件显示音频的大小;
2.播放功能:主要功能是当用户点击“开始播放”按钮时,开始按列表视图中音频文件的顺序播放;另外,还具有暂停播放和停止播放功能;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙湘佩网络技术有限公司,未经长沙湘佩网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710011510.2/2.html,转载请声明来源钻瓜专利网。