[发明专利]异构文档的排序方法、异构文档排序模型训练方法及装置在审

专利信息
申请号: 202011066256.4 申请日: 2020-09-30
公开(公告)号: CN112231546A 公开(公告)日: 2021-01-15
发明(设计)人: 张凯;张钦;吴忠伙;王依然;杨一帆 申请(专利权)人: 北京三快在线科技有限公司
主分类号: G06F16/9532 分类号: G06F16/9532;G06F16/332;G06F16/338
代理公司: 北京三高永信知识产权代理有限责任公司 11138 代理人: 唐述灿
地址: 100080 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文档 排序 方法 模型 训练 装置
【说明书】:

本申请公开了一种异构文档的排序方法、异构文档排序模型训练方法及装置,属于机器学习领域。该方法包括:获取待排序文档,待排序文档携带有文档类型;从待排序文档中提取文档特征与位次特征;调用异构文档排序模型的主网络执行与文档类型对应的第一学习任务,基于文档特征学习出待排序文档的第一点击率;调用异构文档排序模型的子网络执行与文档类型对应的第二学习任务,基于位次特征学习出待排序文档的第二点击率;基于第一点击率与第二点击率确定出待排序文档在文档列表中的排序位次。该方法能够消除统一对异构文档的点击率进行预估的场景下由于异构特征缺失导致的点击率预估不准确的问题,使得异构文档按照点击率得出的排列顺序更合理。

技术领域

本申请涉及机器学习领域,特别涉及一种异构文档的排序方法、异构文档排序模型训练方法及装置。

背景技术

在搜索场景下存在自动补全功能,即是在关键词的输入框内输入部分文字或者文字拼音,在输入框的下方会弹出下拉列表来显示关键词提示,该关键词提示是对上述部分文字或者文字拼音所指示的文字补全后的候选关键词,用户可以在关键词提示中选择出所需搜索的关键词。

在对关键词自动补全时还会在下拉列表中显示除了关键词提示之外的直达词提示,该直达词提示在被选择时直达关键词对应关键词所在的网页页面。上述关键词提示与直达词提示采用不同结构的文档(DOCument,DOC)进行显示,因此,在提供自动补全功能的搜索场景下需要对异构DOC进行排序。传统的异构DOC排序方案是提取出处于同一维度的异构DOC特征,基于同一维度上的异构DOC特征进行排序,比如,在同一维度上提取出关键词提示与直达词提示的特征,基于上述特征对关键词提示与直达词提示进行排序。

由于异构DOC之间存在特征的强弱效应,会导致某一个类型的DOC排序过于靠后或者靠前,比如,直达词提示往往比关键词提示排序更靠前,也即会导致异构DOC排序不合理,无法有效地曝光DOC,降低关键词提示或者直达词提示的点击率。

发明内容

本申请实施例提供了一种异构文档的排序方法、异构文档排序模型训练方法及装置,能够消除统一对异构文档的点击率进行预估的场景下由于异构特征缺失导致的点击率预估不准确的问题,从而使得异构文档按照点击率得出的排列顺序更合理。所述技术方案如下:

根据本申请的一个方面,提供了一种异构文档的排序方法,应用于设置有异构文档排序模型的电子设备中,异构文档排序模型包括主网络与子网络,主网络与子网络之间相互独立,该方法包括:

获取待排序文档,待排序文档携带有文档类型;

从待排序文档中提取文档特征与位次特征,文档特征是指与文档点击率关联的特征,位次特征是指与文档排序位次关联的特征;

调用主网络执行与文档类型对应的第一学习任务,基于文档特征学习出待排序文档的第一点击率;

调用子网络执行与文档类型对应的第二学习任务,基于位次特征学习出待排序文档的第二点击率;

基于第一点击率与第二点击率确定出待排序文档在文档列表中的排序位次。

根据本申请的另一个方面,提供了一种异构文档排序模型训练方法,该方法包括:

获取m组文档样本,文档样本携带有样本文档类型与样本点击率;

从文档样本中提取样本文档特征与样本位次特征,样本文档特征是指与文档点击率关联的特征,样本位次特征是指与文档排序位次关联的特征;

调用待训练的异构文档排序模型执行与样本文档类型对应的学习任务,分别对样本文档特征与样本位次特征进行独立学习,得到文档样本的第一样本点击率和第二样本点击率;

确定第一样本点击率与样本点击率之间、以及第二样本点击率与样本点击率之间的点击率损失;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011066256.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top