[发明专利]一种信息挖掘方法及装置有效
申请号: | 201611155819.0 | 申请日: | 2016-12-14 |
公开(公告)号: | CN106708808B | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 王伟 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F40/40 | 分类号: | G06F40/40;G06F16/953 |
代理公司: | 11227 北京集佳知识产权代理有限公司 | 代理人: | 王宝筠 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 译文 检索 参考信息 检索结果 检索条目 引导作用 网络搜索 信息挖掘 参考 返回 引导式 | ||
本发明公开了一种信息挖掘方法及装置,所述方法包括获得待译对象包含的各个关键词及各关键词对应的翻译译项,从各个关键词对应的翻译译项中确定出至少一个译文引导词,所述译文引导词为各个关键词对应的翻译译项中所起的引导作用较大的翻译译项,将待译对象及译文引导词作为检索依据,检索待译对象对应的翻译参考信息;从检索结果中获取参考价值较高的至少一个检索条目并返回。可见,本发明通过获得待译对象对应的引导作用较大的引文引导词,结合利用待译对象及译文引导词对待译对象对应的翻译参考信息进行引导式检索,并通过从检索结果中获得及返回参考价值较高的至少一个检索条目,有效提升了基于网络搜索的辅助翻译效率及效果。
技术领域
本发明属于数据挖掘技术领域,尤其涉及一种信息挖掘方法及装置。
背景技术
翻译人员的翻译能力不仅取决于其双语水平,还取决于其对翻译工具和翻译资源的掌握能力。随着互联网技术的发展,互联网中蕴含了越来越丰富的能够辅助翻译的网络资源,翻译人员在遇到疑难词汇或短语时也越来越倾向于借助互联网来实现辅助翻译。
目前,基于互联网实现辅助翻译的手段主要有三种:1)借助网络词典,2)借助网络自动翻译机器,3)借助网络搜索引擎从网络搜索翻译参考信息。对于网络词典而言,如在线翻译词典等,由于其尚未提供足够的语境翻译信息,易导致翻译人员在面对同一词汇/短语的多个翻译译项(如计算机对应computer、calculating machine等多个译项)时,往往无法决策;而网络自动翻译机器,如Google在线翻译等,因受机器翻译技术发展水平的限制,翻译质量常不尽如人意,距离实用化还有很大差距;借助网络搜索引擎,可以对互联网上的多语言官方网站、翻译论坛、翻译社区等蕴含的大量双语信息进行检索应用,这些信息具有动态性,并包含了大量的双语语境信息,能够较好地辅助翻译人员进行翻译。
为了提高对互联网上的翻译参考信息进行检索时的检索效率及效果,得到参考价值较高的翻译参考信息,进而实现更好地辅助翻译,如何高效、准确地获取互联网中蕴含的与当前翻译需求关联较紧密的翻译参考信息变得十分重要。
发明内容
有鉴于此,本发明的目的在于提供一种信息挖掘方法及装置,以实现高效、准确地获取互联网中蕴含的与当前翻译需求关联较紧密的翻译参考信息,进而提升基于网络搜索的辅助翻译效率及效果。
为此,本发明公开如下技术方案:
一种信息挖掘方法,包括:
获得待译对象包含的各个关键词,及各个关键词在目标语言中对应的翻译译项;
从各个关键词对应的翻译译项中确定出至少一个译文引导词,所述译文引导词为各个关键词对应的翻译译项中所起的引导作用较大的翻译译项;其中,翻译译项所起的引导作用为:在将待译对象及翻译译项作为检索依据,来利用翻译译项对待译对象进行引导式检索时,翻译译项对检索出所述待译对象对应的翻译参考信息所起到的引导作用;
将所述待译对象及所述译文引导词作为检索依据,检索所述待译对象对应的翻译参考信息,得到检索结果;
基于预定的参考价值评价方式,从所述检索结果包含的各检索条目中获得参考价值较高的至少一个检索条目,并返回所述至少一个检索条目。
上述方法,优选的,所述从各个关键词对应的翻译译项中确定出至少一个译文引导词包括:
对各个关键词的翻译译项按照各翻译译项所起的引导作用的大小进行排序处理,得到一译项序列;
从所述译项序列的相应端获得引导作用较大的至少一个翻译译项作为译文引导词。
上述方法,优选的,所述对各个关键词的翻译译项按照各翻译译项所起的引导作用的大小进行排序处理,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611155819.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:手写笔迹校正方法和装置
- 下一篇:业务数据的处理方法和装置