[发明专利]一种方言识别方法在审
申请号: | 202110187552.8 | 申请日: | 2021-02-18 |
公开(公告)号: | CN112908296A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 郑增亮;苏前敏 | 申请(专利权)人: | 上海工程技术大学 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02;G10L15/06;G10L15/16;G10L15/26;G10L25/87 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 孟旭彤 |
地址: | 201620 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 方言 识别 方法 | ||
1.一种方言识别方法,其特征在于,所述识别方法包括:
收集并录入各地区方言数据,并基于Hadoop平台建立初始方言数据库;
提取所述初始方言数据库中的语音特征,并建立卷积神经网络模型;
对所述卷积神经网络模型进行训练;
将训练后的所述卷积神经网络模型进行用户语音匹配检测,并根据用户满意度的反馈不断对所述初始方言数据库和所述卷积神经网络模型进行优化。
2.如权利要求1所述的一种方言识别方法,其特征在于,所述初始方言数据库中存储的数据包括:各方言所属的地区,与方言对应的语音数据,与方言对应的文本数据,所述用户满意度。
3.如权利要求1所述的一种方言识别方法,其特征在于,所述方言数据包括:语音数据和文本数据,所述语音数据和所述文本数据存储于所述初始方言数据库的分布式文件系统中。
4.如权利要求1所述的一种方言识别方法,其特征在于,所述提取所述方言数据库中的语音特征包括:
使用VAD技术对录入的所述语音数据按频率进行分段处理;
对进行所述分段处理后的所述语音数据采用聚类方法进行降噪处理。
5.如权利要求1所述的一种方言识别方法,其特征在于,所述进行用户语音匹配检测包括:
用户录入方言;
所述卷积神经网络模型对所述用户录入方言进行语音特征提取,获取用户语音特征;
当所述用户语音特征存在于所述初始方言数据库中时,进行语音征匹配,当语音特征匹配成功时,则输出所述用户语音特征的匹配文本,当语音特征匹配不成功时,所述初始方言数据库存储所述用户语音特征并请用户输入所述用户语音特征对应的文本数据;
当所述用户语音特征不存在于所述初始方言数据库中时,所述初始方言数据库存储所述用户语音特征并请用户输入所述用户语音特征对应的文本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海工程技术大学,未经上海工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110187552.8/1.html,转载请声明来源钻瓜专利网。