[发明专利]一种基于语料处理技术的中韩翻译系统在审
申请号: | 202211571433.3 | 申请日: | 2022-12-08 |
公开(公告)号: | CN115828940A | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 杨洋 | 申请(专利权)人: | 吉林农业科技学院 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/30 |
代理公司: | 北京鑫知翼知识产权代理事务所(普通合伙) 11984 | 代理人: | 孙长江 |
地址: | 132101 吉林省*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语料 处理 技术 翻译 系统 | ||
1.一种基于语料处理技术的中韩翻译系统,其特征在于,一种基于语料处理技术的中韩翻译系统,包括翻译机(100),翻译机(100)上安装有主屏(110)和副屏(120),主屏(110)固定安装在翻译机(100)的正面,副屏(120)活动安装在翻译机(100)背面;
翻译机(100)包括:
语音拾取模块,用于拾取待翻译语音,并对语音进行降噪除杂处理;
转换模块,用于将语音信息转换为文字信息,并将文字信息显示在主屏(110)或副屏(120)上,文字信息中包括同音字或词以及近似音的字或词;
纠错模块,用于接受主屏(110)或副屏(120)点击信号,并根据点击信号,选择对应的字或词,纠正文字信息,并将主屏(110)或副屏(120)上未被点击的字或词或标点符号消除,并显示在主屏(110)上;
翻译模块,接收纠正之后的文字信息,翻译出对应的语音信息;
语音播放模块,用于播放翻译之后的语音信息。
2.根据权利要求1所述的一种基于语料处理技术的中韩翻译系统,其特征在于,翻译模块的翻译方法包括如下步骤:
S1:获取文字信息,并按照预存的标准语式进行分词,得到的字词信息表;
S2:用于获取输入的字词信息表,统计汇总字词,根据字词出现的频率对字词增加相应的权重,以及对字词信息表进行属性;
S3:用于根据汇总的字词,在语料库中检索出对应的韩文或中文字词;
S4:用于根据检索出的字词,并筛选出唯一语式,然后按照与分词时语式标准对应的目标语言语式进行组句;
S5:将得到的目标语句在语料库中检索出该标准语句集,该标准语句集包括标准语句和与该标准语句语义相同的常用语句;
S6:根据筛选出语式和使用者的语言习惯选择与该语句语义相同的常用语句;
S7:输出选出的语句。
3.根据权利要求1所述的一种基于语料处理技术的中韩翻译系统,其特征在于,在步骤S1中,对文字信息进行分词的步骤如下:
S11:对文字信息的语式进行分析,得到文字信息的语式分析结果,该语式分析结果至少包括一种预存的标准语式;
S12:根据分析得到的语式,对该文字信息进行分字和/或词,每种语式得到一组字和/或词;
S13:将每组字和/或词编为一条字词信息表。
4.根据权利要求1所述的一种基于语料处理技术的中韩翻译系统,其特征在于,在步骤S2中,会中之后的字词,在字词信息表中出现的频率越高,其对应的权重就越高,字词信息表的属性包括每条字词信息表中各字和/或词的属性。
5.根据权利要求1所述的一种基于语料处理技术的中韩翻译系统,其特征在于,在步骤S3中,在语料库中包括若干组中文和韩文相对应的字和词向对应的翻译集,在语料库中检索出字或词对应的翻译集,并提取翻译集中对应的目标语言的字词。
6.根据权利要求1所述的一种基于语料处理技术的中韩翻译系统,其特征在于,在步骤S4中,根据字词表中字词权重和字词属性重复次数,筛选出权重占比最多,字词属性重复次数最多的字词信息表,提取出该字词信息表对应的语式。
7.根据权利要求1所述的一种基于语料处理技术的中韩翻译系统,其特征在于,在步骤S4中,语式标准包括中文语式标准和韩文语式标准,语式标准存储在语料库中,语料库中还包括若干语式集,该语式集为相互匹配的中文语式标准和韩文语式标准的集合,根据步骤S11中分析出的语式,在语料库中,检索出对应的语式集,并将目标语言的语式标准提出,然后将翻译之后的字词按照目标语言的语式标准进行组合。
8.根据权利要求1所述的一种基于语料处理技术的中韩翻译系统,其特征在于,在步骤S5中,标准语句集为语式-标准语句-语义相同的常用语句的映射集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林农业科技学院,未经吉林农业科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211571433.3/1.html,转载请声明来源钻瓜专利网。