[发明专利]一种智能化跨语言语音识别转化方法有效
申请号: | 201711371095.8 | 申请日: | 2017-12-19 |
公开(公告)号: | CN107945805B | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 程海波;文向东;于晓;赵季辉;李亮 | 申请(专利权)人: | 北京烽火万家科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/18;G10L15/10;G10L15/02;G10L15/00 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 张建纲 |
地址: | 100085 北京市海淀区安*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能化 语言 语音 识别 转化 方法 | ||
本发明请求保护的一种智能化跨语言语音识别转化方法通过将语音数据基于语系进行类别划分,建立语系类间距离,将待识别语音的数据初步确定语系后再在语系中进行语种的细化识别,而在首次语系识别错误后还可以基于建立好的语系类间距离进一步查找相邻语系,确认语系;在识别出语种后将其转化为规范化文字并对文本进行分词、词频统计等处理建立映射关系便于后续语音查询。本发明一方面有效的解决了当前语音识别中效率与速率不能平衡的弊端,另一方面,对语音文字转换的处理更为合理,映射关系的建立使得识别转化效率准确度更高。
技术领域
本发明涉及自然语言处理,特别地,涉及一种智能化跨语言语音识别转化方法,用于识别多种语言的语音资料并转化为文本格式进行文本识别。
背景技术
语音是人类最重要、最方便和最有效的信息传递方式,语言是人类独有的功能,声音是人类常用的交流工具。当进入21世纪信息化时代,通过先进的语音处理技术,对语音信息进行更加有效地产生、传输、获取、存储和应用,这将极大地促进社会的发展。
语音信号处理,简称为语音处理,它是语音学和数字信号处理技术相结合的交叉性的学科,最初包括语音识别、说话人识别、语音合成和语音编码四大分支。随着科学技术的不断发展,语种识别技术逐渐成为语音处理领域的又一热点问题。据有关资料统计,当今世界上共有5651种语言,语种之间的信息互通越来越重要,如何让计算机识别出不同的语种己经成为人们的迫切需求。
语种识别,是计算机通过分析处理一段语音片断以判别其属于何种语言的过程,本质上也是属于语音识别的一个分支。语种识别往往作为语音识别和其它相关应用的一个前端处理技术,随着全球化经济的发展,全球范围内的人员流动和国际间商务交流对多语对话系统、口语翻译系统、语音合成和多语种语音识别系统的应用需求快速增长,作为这类系统的必要的前端处理,语种识别技术扮演着非常重要的角色。
而对语音识别后的另一项重要工作就是将语音转化为文本格式的内容供后续处理,如人机对话、搜索引擎查询等业务,语音到文本的转化的成功率和效率也直接决定了用户在网络环境中的直接体验。
专利201710309321.3公开了一种基于中英文混合词典的语音识别方法及装置,通过获取中英文混合词典作为训练词典,训练得到声学模型,基于声学模型对中英文混合语言进行语音识别;专利201710414207.7公开了一种基于人工智能的语音识别方法,其采用将待识别的语音数据建立声学模型,确定能量特征后转化文本数据。可以看出,现有技术中,针对语音的识别和文本转化技术已经较为很多,但基本的思路都是建立语料库后提取待识别语音数据的基本特征,之后直接进行相应的文本转换,导致语音识别时的算法复杂度较高,识别准确度也无法保证,识别后的容错性鲁棒性较低,造成了语音识别用户的体验性较差。
基于此,本发明请求保护一种智能化跨语言语音识别转化方法,其可以对语言进行语系的初步划分,并在各语系之间建立类间关系表,在对语音数据预处理识别出语系后再进一步识别相应的语种,之后,将相应的语音转化为对应的文字后还会建立文字段与语音语种、语系的映射关系便于后续识别。
发明内容
针对现有技术的缺陷,本发明的目的是提供一种智能化跨语言语音识别转化方法,用于解决当前语音文字转化识别效率低的问题。
本发明所请求保护的一种智能化跨语言语音识别转化方法,其特征具体包括:
步骤一:获取待识别转化的语音数据以及语音数据库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京烽火万家科技有限公司,未经北京烽火万家科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711371095.8/2.html,转载请声明来源钻瓜专利网。