[发明专利]文档推荐方法、装置、电子设备和介质有效
申请号: | 202110122271.4 | 申请日: | 2021-01-28 |
公开(公告)号: | CN112818111B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 徐伟;夏晓玲;何伯磊;陈坤斌;刘准;和为 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/31;G06F16/9538;G06F16/35 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 王文思 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 推荐 方法 装置 电子设备 介质 | ||
1.一种文档推荐方法,包括:
获取用户操作的文档作为参考文档;
从多个初始文档中确定针对所述参考文档的至少一个候选文档,其中,每个所述候选文档的文档内容基于预设知识体系数据与所述参考文档的文档内容相关联;以及
将所述至少一个候选文档中的目标文档推荐给所述用户,所述目标文档包括用户当前感兴趣的文档和用户在预设时间段之后感兴趣的文档;
其中,所述预设知识体系数据包括多个文档标识,所述多个文档标识中的每个文档标识包括知识章节信息;所述从多个初始文档中确定针对所述参考文档的至少一个候选文档包括:
获取所述参考文档的参考文档标识;
基于所述参考文档标识,从所述多个文档标识中确定至少一个候选文档标识,其中,每个候选文档标识的知识章节信息与所述参考文档标识的知识章节信息相同;以及
从所述多个初始文档中确定具有所述候选文档标识的至少一个初始文档,作为所述至少一个候选文档;
其中,所述每个文档标识还包括属于知识章节的知识点的知识点信息,所述多个文档标识按照顺序排列,所述至少一个候选文档标识包括一个候选文档标识;所述候选文档标识和所述参考文档标识之间的关系满足:
所述候选文档标识的顺序在所述参考文档标识的顺序之后,所述候选文档标识的知识点信息所表征的知识点是所述参考文档标识的知识点信息所表征的知识点的下一个知识点。
2.根据权利要求1所述的方法,其中,所述候选文档标识和所述参考文档标识之间的关系还满足:
所述候选文档标识的知识点信息与所述参考文档标识的知识点信息相同。
3.根据权利要求1所述的方法,其中,所述将所述至少一个候选文档中的目标文档推荐给所述用户包括:
响应于用户针对瀑布流式页面上显示的内容执行的滑动操作,将所述至少一个候选文档中的目标文档推荐给所述用户。
4.根据权利要求1所述的方法,其中,所述将所述至少一个候选文档中的目标文档推荐给所述用户包括:
响应于用户针对所述参考文档的文档内容进行浏览操作,将所述至少一个候选文档标识推荐给所述用户;以及
响应于所述用户从所述至少一个候选文档标识中选择的目标文档标识,将所述至少一个候选文档中具有所述目标文档标识的目标文档推荐给所述用户。
5.根据权利要求1-4中任意一项所述的方法,其中,所述参考文档包括以下至少之一:
用户在预设时间段内执行点击操作或收藏操作的历史文档;
用户对文档内容进行浏览的当前文档。
6.根据权利要求1-4中任意一项所述的方法,还包括:
获取至少一个原始素材;
处理所述至少一个原始素材,得到所述原始素材的目录数据;以及
基于所述目录数据,得到所述预设知识体系数据。
7.根据权利要求1或2所述的方法,还包括:
利用经训练的分类模型对所述多个初始文档中的每个所述初始文档进行分类,得到针对每个所述初始文档的分类结果;以及
基于所述分类结果,确定每个所述初始文档的初始文档标识。
8.根据权利要求7所述的方法,其中,所述分类模型是基于以下方式得到的:
获取针对每个文档标识的训练样本,其中,所述训练样本的标签为该训练样本所对应的文档标识;以及
利用所述训练样本和所述训练样本的标签训练分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110122271.4/1.html,转载请声明来源钻瓜专利网。