[发明专利]一种跨语言搜索方法和装置、一种用于跨语言搜索的装置有效
申请号: | 201710025472.6 | 申请日: | 2017-01-13 |
公开(公告)号: | CN108304412B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 翟飞飞;张骏;许静芳;薛征山;祝天刚;于恒 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F40/58;G06F40/30;G06F40/289 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 刘祥景 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语言 搜索 方法 装置 用于 | ||
1.一种跨语言搜索方法,其特征在于,包括:
获取第一语种的搜索词;
根据所述搜索词,获取第二语种的搜索结果;
针对每个第二语种的搜索结果,执行以下步骤:
确定与所述搜索结果的各预设展示部分相对应的目标翻译模型;
利用所述目标翻译模型,获取所述搜索结果的各预设展示部分对应的翻译搜索结果;
向用户展示所述搜索结果的各预设展示部分对应的翻译搜索结果;
所述利用所述目标翻译模型,获取所述搜索结果的各预设展示部分对应的翻译搜索结果的步骤,包括:
若所述预设展示部分为标题部分,则识别所述标题部分所包含的预置符号;依据所述预置符号,将所述标题部分分割为多个语义单元;利用所述标题部分对应的第一目标翻译模型对分割得到的各语义单元进行翻译,以得到各语义单元对应的翻译结果;依据所述预置符号,对所述各语义单元对应的翻译结果进行组合,以得到所述标题部分对应的第一翻译搜索结果;所述第一翻译搜索结果包括所述预置符号;所述第一目标翻译模型为标题翻译模型,所述标题翻译模型为依据标题语料训练得到;
若所述预设展示部分为摘要部分,则从所述摘要部分中提取位于预置位置的目标内容;利用所述预置位置对应的第二目标翻译模型,对所述目标内容进行翻译,以得到对应的第二翻译搜索结果;所述第二目标翻译模型为根据预置位置对应的预置内容语料训练得到。
2.根据权利要求1所述的方法,其特征在于,所述确定与所述搜索结果的各预设展示部分相对应的目标翻译模型的步骤,包括:
确定所述搜索结果包含的各预设展示部分对应的展示类型;
依据所述展示类型,获取与各预设展示部分相对应的目标翻译模型。
3.根据权利要求2所述的方法,其特征在于,若所述预设展示部分对应的展示类型为页面内容类,则所述获取与各预设展示部分相对应的目标翻译模型包括:获取页面内容翻译模型,所述内容翻译模型为依据预置页面内容语料训练得到。
4.根据权利要求1所述的方法,其特征在于,所述利用所述标题部分对应的第一目标翻译模型对分割得到的各语义单元进行翻译的步骤,包括:
分别将各语义单元及其对应的上下文输入至所述第一目标翻译模型,以得到所述第一目标翻译模型输出的各语义单元对应的翻译结果。
5.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:确定所述搜索结果所属的目标类别;
所述依据所述展示类型,获取与各预设展示部分相对应的目标翻译模型包括:
结合所述搜索结果所属的目标类别和各预设展示部分对应的展示类型,获取各预设展示部分相对应的目标翻译模型。
6.根据权利要求5所述的方法,其特征在于,所述确定所述搜索结果所属的目标类别的步骤,包括:
分别将所述搜索结果包括的内容与各预置类别的词典进行匹配,以得到各预置类别对应的匹配率;
将所有预置类别对应的匹配率中的最大者对应的预置类别,作为所述搜索结果所属的目标类别。
7.根据权利要求5所述的方法,其特征在于,所述确定所述搜索结果所属的目标预置类别的步骤,包括:
将搜索结果包括的内容输入分类器,并将所述分类器输出的分类结果作为所述搜索结果所属的目标类别;其中,所述分类器为依据各预置类别的搜索结果样本训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710025472.6/1.html,转载请声明来源钻瓜专利网。