[发明专利]一种个性化的跨语言检索方法及装置在审
申请号: | 201310157682.2 | 申请日: | 2013-05-02 |
公开(公告)号: | CN103268326A | 公开(公告)日: | 2013-08-28 |
发明(设计)人: | 何伯磊;马艳军;吴华;王海峰 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/28 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 个性化 语言 检索 方法 装置 | ||
1.一种个性化的跨语言检索方法,包括:
A.获取用户查询词;
B.在目标语言网页集合中获取与所述查询词相匹配的检索结果;
C.确定所述用户的目标语言水平以及所述检索结果在目标语言上的整体难度,并根据所述用户的目标语言水平与所述整体难度之间的匹配度对所述检索结果进行返回。
2.根据权利要求1所述的方法,其特征在于,所述查询词包括以源语言表示的查询词或以目标语言表示的查询词。
3.根据权利要求1所述的方法,其特征在于,所述步骤C中,采用第一评分模型对所述用户的目标语言水平进行评分,其中所述第一评分模型的评分参数至少包括所述用户的历史查询词与预设的各难度级别词库之间的匹配率。
4.根据权利要求1所述的方法,其特征在于,所述步骤C中,采用第二评分模型对所述检索结果在目标语言上的整体难度进行评分,其中所述第二评分模型的评分参数至少包括以下一种:所述检索结果包含的词语与预设的各难度级别词库之间的匹配率、所述检索结果包含的句子所属句型类型以及所述检索结果来源网站类型。
5.根据权利要求1所述的方法,其特征在于,根据所述用户的目标语言水平与所述整体难度之间的匹配度对所述检索结果进行返回的步骤包括:
对所述检索结果在目标语言上的局部难度进行评估,并对所述局部难度与所述用户的目标语言水平之间的匹配度低于预设值的文本进行标注;
按照所述用户的目标语言水平与所述整体难度之间的匹配度对所述检索结果进行排序并返回。
6.根据权利要求5所述的方法,其特征在于,所述方法进一步包括:当探测到所述用户的鼠标移入所述检索结果的标注文本时,触发机器翻译将所述标注文本翻译为源语言。
7.一种个性化的跨语言检索装置,包括:
输入单元,用于获取用户查询词;
检索单元,用于在目标语言网页集合中获取与所述查询词相匹配的检索结果;
确定单元,用于确定所述用户的目标语言水平以及所述检索结果在目标语言上的整体难度;
返回单元,用于根据所述用户的目标语言水平与所述整体难度之间的匹配度对所述检索结果进行返回。
8.根据权利要求7所述的装置,其特征在于,所述查询词包括以源语言表示的查询词或以目标语言表示的查询词。
9.根据权利要求7所述的装置,其特征在于,所述确定单元采用第一评分模型对所述用户的目标语言水平进行评分,其中所述第一评分模型的评分参数至少包括所述用户的历史查询词与预设的各难度级别词库之间的匹配率。
10.根据权利要求7所述的装置,其特征在于,所述确定单元采用第二评分模型对所述检索结果在目标语言上的整体难度进行评分,其中所述第二评分模型的评分参数至少包括以下一种:所述检索结果包含的词语与预设的各难度级别词库之间的匹配率、所述检索结果包含的句子所属句型类型以及所述检索结果来源网站类型。
11.根据权利要求7所述的装置,其特征在于,所述返回单元包括:
标注单元,用于对所述检索结果在目标语言上的局部难度进行评估,并对所述局部难度与所述用户的目标语言水平之间的匹配度低于预设值的文本进行标注;
排序单元,用于按照所述用户的目标语言水平与所述整体难度之间的匹配度对所述检索结果进行排序并返回。
12.根据权利要求11所述的装置,其特征在于,所述装置进一步包括:
翻译单元,用于当探测到所述用户的鼠标移入所述检索结果的标注文本时,触发机器翻译将所述标注文本翻译为源语言。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310157682.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种存储方法及装置
- 下一篇:高并发交易数据处理方法和装置