[发明专利]一种跨语言搜索方法和装置、一种用于跨语言搜索的装置有效
申请号: | 201710025472.6 | 申请日: | 2017-01-13 |
公开(公告)号: | CN108304412B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 翟飞飞;张骏;许静芳;薛征山;祝天刚;于恒 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F40/58;G06F40/30;G06F40/289 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 刘祥景 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语言 搜索 方法 装置 用于 | ||
本发明实施例提供了一种跨语言搜索方法和装置、一种用于跨语言搜索的装置,其中的方法具体包括:获取第一语种的搜索词;根据所述搜索词,获取第二语种的搜索结果;针对每个第二语种的搜索结果,执行以下步骤:确定与所述搜索结果的各预设展示部分相对应的目标翻译模型;利用所述目标翻译模型,获取所述搜索结果的各预设展示部分对应的翻译搜索结果;向用户展示所述搜索结果的各预设展示部分对应的翻译搜索结果。本发明实施例能够提高翻译搜索结果的准确度。
技术领域
本发明涉及信息搜索技术领域,特别是涉及一种跨语言搜索方法和装置、一种用于跨语言搜索的装置。
背景技术
随着互联网信息的不断增长,人们对于信息搜索提出了更高的要求,不再满足于在同一种语种数据库中搜索,而要求获取多种语种数据。例如,如果用户输入的搜索词(query))为“搜索词A”,则中文数据库中的搜索可能并不能最大程度地满足用户需求,源自欧美网站的英文数据库中可能具有更优、更多的搜索结果。
跨语言搜索技术结合了信息检索技术和机器翻译技术。现有的跨语言搜索方案的实现过程具体可以包括:首先,通过机器翻译技术将源语言形式的搜索词转换为目标语言形式的搜索词,然后,分别依据源语言形式的搜索词和目标语言形式的搜索词,在对应的单语言数据库中进行信息检索,以得到多语言的搜索结果,其中,多语言的搜索结果可以包括:源语言的搜索结果和目标语言的搜索结果。
为了满足不具备目标语言阅读能力、或者目标语言的阅读能力有限的用户的需求,现有方案可以利用翻译模型,对目标语言的搜索结果进行翻译,以得到源语言形式的翻译搜索结果。
发明人在实施本发明实施例的过程中发现,现有方案至少存在如下问题:现有方案通常采用通用翻译模型对目标语言的搜索结果进行翻译,该通用翻译模型的局限性容易影响翻译搜索结果的准确度,也即,现有方案中得到的翻译搜索结果的准确度较低。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的跨语言搜索方法、跨语言搜索装置及用于跨语言搜索的装置,本发明实施例能够提高翻译搜索结果的准确度。
为了解决上述问题,本发明公开了一种跨语言搜索方法,包括:
获取第一语种的搜索词;
根据所述搜索词,获取第二语种的搜索结果;
针对每个第二语种的搜索结果,执行以下步骤:
确定与所述搜索结果的各预设展示部分相对应的目标翻译模型;
利用所述目标翻译模型,获取所述搜索结果的各预设展示部分对应的翻译搜索结果;
向用户展示所述搜索结果的各预设展示部分对应的翻译搜索结果。
可选地,所述确定与所述搜索结果的各预设展示部分相对应的目标翻译模型的步骤,包括:
确定所述搜索结果包含的各预设展示部分对应的展示类型;
依据所述展示类型,获取与各预设展示部分相对应的目标翻译模型。
可选地,若所述预设展示部分对应的展示类型为标题类,则所述获取与各预设展示部分相对应的目标翻译模型包括:获取标题翻译模型,所述标题翻译模型为依据标题语料训练得到;
和/或,
若所述预设展示部分对应的展示类型为摘要类,则所述获取与各预设展示部分相对应的目标翻译模型包括:获取摘要翻译模型,所述摘要翻译模型为依据摘要语料训练得到;
和/或,
若所述预设展示部分对应的展示类型为页面内容类,则所述获取与各预设展示部分相对应的目标翻译模型包括:获取页面内容翻译模型,所述内容翻译模型为依据预置页面内容语料训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710025472.6/2.html,转载请声明来源钻瓜专利网。