[发明专利]非常规词语或非常规短句的判断以及翻译方法及其系统有效
申请号: | 201710677904.1 | 申请日: | 2017-08-08 |
公开(公告)号: | CN107451129B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 王静 | 申请(专利权)人: | 传神语联网网络科技股份有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/30;G06F16/245;G06F16/2458 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430073 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 常规 词语 短句 判断 以及 翻译 方法 及其 系统 | ||
1.一种非常规词语或非常规短句的判断以及翻译方法,该方法包括如下步骤:
S1:获取待翻译的中文词语或者中文短句;
S2:判断该中文词语或者中文短句是否属于非常规词语或者非常规短句,
S3:如果该中文词语或者中文短句不属于非常规词语或者非常规短句,则采用常规翻译方法获得翻译结果,进入步骤S7;否则进入步骤S4:
S4:如果是中文词语,对其进行语义分析,将中文词语转化为汉语拼音;如果是中文短句,则对该短句进行语义切分,将短句切分成至少一个中文词语,将所述中文词语进行语义分析,并将所述中文词语转化为汉语拼音;
S5:根据所述汉语拼音,在至少一个预先建立的外文语料库中进行检索,获得与所述汉语拼音对应的至少一个外文翻译词汇;
S6:从所述至少一个外文翻译词汇中,选择一个词汇作为该汉语拼音对应的中文词语或者中文短句的翻译结果;
S7:显示所述待翻译的中文词语或者中文短句翻译结果;
其特征在于:
步骤S2中判断该中文词语或者中文短句是否属于非常规词语或者非常规短句,是指判断该中文词语或者中文短句首次出现的时间是否晚于某一个预设时间节点,以及,
判断该中文词语或者中文短句在某一预设时间段内出现的频率是否低于某一个预设值;
步骤S5中,所述根据所述汉语拼音,在至少一个预先建立的外文语料库中进行检索,获得与所述汉语拼音对应的至少一个外文翻译词汇,具体包括:
所述预先建立的外文语料库,是指利用网络爬虫程序,以所述预设时间节点为起点,在互联网外文语料中采集该预设时间节点之后出现的外文词汇;
和/或,
利用网络爬虫程序,在互联网外文语料中采集该预设时间段内出现的外文词汇。
2.如权利要求1所述的方法,步骤S6中,从所述至少一个外文翻译词汇中,选择一个词汇作为该汉语拼音对应的中文词语或者中文短句的翻译结果,进一步包括:如果该汉语拼音来自于中文词语,则按照如下方式之一确定该中文词语的翻译结果:
如果不同外文语料库中检索得到多个不同外文翻译词汇,则统计每个外文翻译词汇在每个外文语料库中出现的次数,选择出现次数最多的外文翻译词汇作为该汉语拼音对应的中文词语或者中文短句的翻译结果;
或者:
选择所有外文语料库中出现时间最晚的外文翻译词汇作为该汉语拼音对应的中文词语或者中文短句的翻译结果。
3.如权利要求1所述的方法,步骤S6中,从所述至少一个外文翻译词汇中,选择一个词汇作为该汉语拼音对应的中文词语或者中文短句的翻译结果,进一步包括:如果该汉语拼音来自于中文短句的某一个切分中文词语,则继续获取由步骤S4得到的该中文短句的其他切分中文词语的翻译结果。
4.如权利要求1-3任一项所述的方法,所述互联网外文语料库选自发布外文新闻的主流新闻媒体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于传神语联网网络科技股份有限公司,未经传神语联网网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710677904.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种小颗粒金属固体废物水处理装置
- 下一篇:一种改进型三级物料分选装置