[发明专利]一种机器翻译语料领域识别方法在审

专利信息
申请号: 202210803861.8 申请日: 2022-07-07
公开(公告)号: CN115331659A 公开(公告)日: 2022-11-11
发明(设计)人: 王艺宁;胡环环;刘明皓 申请(专利权)人: 合肥群音信息服务有限公司
主分类号: G10L15/06 分类号: G10L15/06;G10L15/26;G10L21/0208;G10L25/51;G06F40/58
代理公司: 合肥正则元起专利代理事务所(普通合伙) 34160 代理人: 李敏
地址: 230000 安徽*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 机器翻译 语料 领域 识别 方法
【说明书】:

发明公开了一种机器翻译语料领域识别方法,涉及语音识别技术领域,包括:通过爬虫技术获取互联网语料数据,并通过特定的分类算法对语料元数据进行预处理,构建语料知识库;对采集的语音数据进行降噪增强处理,消除干扰信号,剔除误差;对降噪处理后的语音数据进行清晰度偏离检测;若清晰度偏离值QX大于偏离阈值,则判定对应语音数据无效,提示用户重新采集语音数据;通过语音识别模块对判定有效的语音数据进行语音识别;在机器翻译过程中,根据降噪处理信息对当前环境的噪声干扰情况进行评估;若语音干扰系数YR大于干扰阈值,则生成预警信号;以提醒用户更换场所后继续翻译,从而提高识别精度,提高用户体验感。

技术领域

本发明涉及语音识别技术领域,具体是一种机器翻译语料领域识别方法。

背景技术

机器翻译(machinetranslation,mt)是用计算机来自动实现不同语言之间的翻译,是跟人工翻译相对应的。机器翻译研究的就是源语言如何映射到目标语言的问题。从理论上来说,机器翻译的研究涉及到计算机、语言学、数学以及逻辑学等多个学科,属于交叉学科范围,是目前世界上最具挑战的科学问题之一,具有重要的理论价值。从实践上来看,机器翻译可以解决不同语言的翻译问题,极大地解放人力资源,节省时间。

然而,现有的机器翻译设备还是停留在以短语为基础的翻译模型上,基于句法的模型才刚起步,很大的一个问题就是缺少句法语料库;同时缺乏对语音数据的质量检测,当噪声干扰严重时,识别精度很低,不能保证识别语音清晰和准确,语音识别速度还有待提高,影响用户使用感受;基于以上不足,本发明提出一种机器翻译语料领域识别方法。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种机器翻译语料领域识别方法。

为实现上述目的,根据本发明的第一方面的实施例提出一种机器翻译语料领域识别方法,包括如下步骤:

步骤一:通过爬虫技术获取互联网语料数据,并通过特定的分类算法对语料元数据进行预处理,进而构建语料知识库;

步骤二:通过安装在室内不同位置的麦克风采集语音数据,对采集的语音数据进行降噪增强处理,消除干扰信号,剔除误差;并将噪声等级和降噪处理时长融合形成降噪处理信息;

步骤三:对降噪处理后的语音数据进行清晰度偏离检测;若清晰度偏离值QX大于偏离阈值,则判定对应语音数据无效,提示用户重新采集语音数据;否则判定对应语音数据有效;

步骤四:通过语音识别模块对判定有效的语音数据进行语音识别产生分析文本,并将分析文本返回至控制器,控制器用于根据分析文本调取语料知识库数据并推送至用户的移动终端;

步骤五:在机器翻译过程中,根据降噪处理信息对当前环境的噪声干扰情况进行评估;若语音干扰系数YR大于干扰阈值,则生成预警信号;以提醒用户当前环境干扰严重,建议更换场所后继续翻译。

进一步地,步骤二中对语音数据进行降噪增强处理的具体过程为:

获取语音数据,将语音数据转换为电信号;对转换的电信号进行数字信号处理;通过数字滤波得到电信号的频谱分布,通过数值的大小分析得到电信号的强度分布;进而根据频率与强度区分出噪声信号;

获取对应的噪声信号的周期能量值,并标记为NE1;其中周期能量值是指对接收到的连续多个比特位数据的能量进行累加并求平均所得到的值;根据周期能量值NE1,确定噪声信号的噪声等级为Dg;根据噪声等级Dg确定对应的降噪增益值为Zg;按照降噪增益值Zg对噪声信号进行降噪处理。

进一步地,数据库中存储有周期能量值范围与噪声等级的对照表以及噪声等级与降噪增益值的对照表。

进一步地,当周期能量值NE1≤能量阈值且持续时长超过预设时长阈值时,则降噪处理结束,将噪声等级和降噪处理时长融合形成降噪处理信息并将降噪处理时长打上时间戳存储至本地数据库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥群音信息服务有限公司,未经合肥群音信息服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210803861.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top