[发明专利]一种智能化跨语言语音识别转化方法有效
申请号: | 201711371095.8 | 申请日: | 2017-12-19 |
公开(公告)号: | CN107945805B | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 程海波;文向东;于晓;赵季辉;李亮 | 申请(专利权)人: | 北京烽火万家科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/18;G10L15/10;G10L15/02;G10L15/00 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 张建纲 |
地址: | 100085 北京市海淀区安*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明请求保护的一种智能化跨语言语音识别转化方法通过将语音数据基于语系进行类别划分,建立语系类间距离,将待识别语音的数据初步确定语系后再在语系中进行语种的细化识别,而在首次语系识别错误后还可以基于建立好的语系类间距离进一步查找相邻语系,确认语系;在识别出语种后将其转化为规范化文字并对文本进行分词、词频统计等处理建立映射关系便于后续语音查询。本发明一方面有效的解决了当前语音识别中效率与速率不能平衡的弊端,另一方面,对语音文字转换的处理更为合理,映射关系的建立使得识别转化效率准确度更高。 | ||
搜索关键词: | 一种 智能化 语言 语音 识别 转化 方法 | ||
【主权项】:
1.一种智能化跨语言语音识别转化方法,其特征在于:步骤一:获取待识别转化的语音数据以及语音数据库;步骤二:依据语音数据的属性数据对语音数据进行预处理,与语音数据库中的语音数据初步比对,识别出语音数据所属的语言语系;步骤三:对初步识别出语言语系的语音数据进行判断纠正,如果语言语系识别出现错误,返回步骤二,如果正确,进入步骤四;步骤四:对识别出语言语系的语音数据进行边界分割,针对不同语言语系的语音数据的特点,决策出当前语音数据所属的具体语种;步骤五:基于声线模型对语音数据的音频特征进行识别,根据音频特征的归一化表示将语音数据转写为文本数据;步骤六:对转化后的文本数据进行基于正则文法的处理,对文本进行消歧处理,规范文本的语义规则;步骤七:建立消歧后的文本数据与原始的待识别转化的语音数据的映射关系,将待识别的语音数据存储至语音数据库中;所述语音数据库中的样本语言数据事先进行训练与聚类分析,首先,记录样本语言数据的语言表现序列,预设语言表现集合,获取每一个样本语言数据的语言表现序列的长度,使用上层标记序列在语言表现序列与预设语言表现集合之间建立映射关系,确定出样本语言数据所属的语言表现类别,建立相应的类别表存储在语音数据库中,其中的类别表内部具体表明了语言语系与具体语种之间的映射包含关系,同时语系与语系之间通过类间距离计算描述语系之间的相似度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京烽火万家科技有限公司,未经北京烽火万家科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711371095.8/,转载请声明来源钻瓜专利网。