[发明专利]全息方言语音取样技术在审
申请号: | 201610215585.8 | 申请日: | 2016-04-08 |
公开(公告)号: | CN107274914A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 王雪飞 | 申请(专利权)人: | 黄山学院 |
主分类号: | G10L25/48 | 分类号: | G10L25/48 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 245041 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 全息 方言 语音 取样 技术 | ||
1.一种基于方言声学特征与地域属性数据采集的技术方案,其特征包括多维度方言声学数据采集方案与方言声学数据的存储管理技术的实现;其中,多维度方言声学数据采集的实现,包括方言语音数据多维度采集框架与多传感器传感通道的采集原理框架;
方言声学数据的存储管理技术的实现,包括了声学HTK特征数据格式方案,方言的声学分析监控过程。
2.根据权利1所述的方言语音数据多维度采集框架,其特征是多传感器通道,声音源数据的位置标识,声音帧数据排列电路,具体包括:
多传感器通道,由每通道的数字电子报文格式,形成声音信号的传输单元,传输单元有通道与传感器特征标识符号;
声音源数据的位置标识,由传感器的设备码在数字信号电子报文生成器中形成;
声音帧数据排列电路,是一种时序帧数据排列电路,形成帧存储表。
3.根据权利1所述的方言声学分析监控过程,其特征是方言声学的HTK的mel(梅耳系数)格式数据文件,原声音格式文件与方言属性参数的显示,具体包括:
方言声学的HTK的mel(梅耳系数)格式数据文件,由HTK格式式文件形成框架形成文件;
原声音格式文件,是指声源形成的声音格式文件;
方言属性参数的显示,是指方言朗读人的行政地址与GPS探测的经纬度、朗读人的身份信息。
4.根据权利1所述的声学HTK特征数据格式方案,其特征使用了具有HTK功能的DSP系统,HTK存储,HTK连接器,具体包括:
HTK功能的DSP系统,是指包括了HTK格式文件形成电路;
HTK存储,指声音经过HTK处理后形成的对应文件存储;
HTK连接器,是指HTK格式文件的输出接口,由usb接口形成。
5.根据权利1所述的方言声学数据,其特征是形成可查询索引存在的存储文件与原文件一一对应,具体表现为:
可查询索引存在的存储文件,是指通过输入方言的声音文件形成对应已经方言属性的声音文件查询;
原文件一一对应,是指存储文件中的HTK格式文件与多声音源文件具有唯一相关性。
6.一种如权利1要求所述的方言声学数据采样技术步骤,其特征在于,包括如下步骤:
1) 打开显示器,显示方言类型识别文字,同时GPS模块启动;
2) 按启动键后,多通道声音传感器启动,并处理工作状态后显示采样开始字样;
3) 朗读人对着话筒开始朗读;
4) 每屏只显示一个字或一个词,或一外短句,显示时间分自动与手动;
5) 每次由100个字组成;
6) 朗读结束后,自动显示本次的方言数据谱数据;
7) 界面有标准方言的音-字库生成键,步骤同上述但结果存入flash数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黄山学院,未经黄山学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610215585.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种声音识别方法及装置
- 下一篇:叠瓦式磁性记录带间磁道间距调谐