[发明专利]资源推荐方法、装置以及存储介质在审
申请号: | 202211723980.9 | 申请日: | 2022-12-30 |
公开(公告)号: | CN115982357A | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 赖培源;周宇轩;廖晓东;廖德章;王增辉;李奎;李岱素;邱姗姗 | 申请(专利权)人: | 广东省华南技术转移中心有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/36;G06F40/289;G06F18/25;G06N3/045 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 杜毅 |
地址: | 511457 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资源 推荐 方法 装置 以及 存储 介质 | ||
1.一种资源推荐方法,包括:
生成资源的数字表征信息;其中,所述数字表征信息包括:资源ID、资源类型和词向量;
对所述词向量进行向量聚类处理,获得与所述资源相对应的词向量组;
对与所述资源相对应的词向量组进行聚合处理,生成与所述资源相对应的资源特征向量;
确定用户实体与所述资源之间的关系信息,基于所述用户实体、所述资源的资源特征向量和所述关系信息构建知识图谱;
在所述知识图谱中确定资源特征向量之间的关联关系,构建资源特征向量之间的路径权重;
根据用户的交互行为类型并基于所述资源特征向量,生成多个交互行为数据集,并基于所述多个交互行为数据集生成多个训练样本,对多个预测模型进行训练;
使用所述知识图谱和/或训练好的预测模型进行资源推荐处理。
2.如权利要求1所述的方法,所述生成资源的数字表征信息包括:
对所述资源的描述文本进行分词处理,获得多个分词;
生成与各个分词相对应的词向量;
基于所述资源ID、所述资源类型、所述词向量生成所述数字表征信息。
3.如权利要求2所述的方法,所述对所述词向量进行向量聚类处理,获得与所述资源相对应的词向量组包括:
在全部词向量中获取词向量集合;其中,所述词向量集合中的词向量数量等于预设的向量数量;
对所述词向量集合进行分组处理,获得多个词向量子集合;其中,所述词向量子集合的总数量等于预设的分组数量;
对于所述词向量子集合中的全部词向量进行语义相似度聚类处理,从所述全部词向量中获得多个聚类词向量,并基于此多个聚类词向量生成所述词向量组。
4.如权利要求3所述的方法,所述对于所述词向量子集合中的全部词向量进行语义相似度聚类处理,从所述全部词向量中获得多个聚类词向量包括:
计算所述全部词向量中的任意两个词向量之间的第一余弦相似度;
基于与至少一个最大第一余弦相似度对应的两个词向量,获得多个聚类词向量。
5.如权利要求1所述的方法,所述对与所述资源相对应的词向量组进行聚合处理,生成与所述资源相对应的资源特征向量包括:
对于各个词向量组中的聚类词向量进行降维处理,使得各个词向量组中的聚类词向量的维度都相同;
对各个词向量组中的全部聚类词向量进行求和运算,生成所述资源特征向量。
6.如权利要求1所述的方法,所述在所述知识图谱中确定资源特征向量之间的关联关系,构建资源特征向量之间的路径权重包括:
计算所述资源特征向量之间的第二余弦相似度;
获得与大于相似度阈值的第二余弦相似度对应两个资源特征向量,在此两个资源特征向量之间建立关联关系;
通过注意力机制确定所述资源特征向量之间的传播偏好系数;
基于所述传播偏好系数构建资源特征向量之间的路径权重。
7.如权利要求1所述的方法,其中,
所述资源包括:科技成果、学术论文、发明专利、科研人才、以及科技企业、技术需求中的至少一项;
所述交互行为数据集包括:所述资源特征向量、所述用户实体以及所述资源特征向量和所述用户实体之间的交互关系;所述预测模型包括:CTR预估模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省华南技术转移中心有限公司,未经广东省华南技术转移中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211723980.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信道调优方法及装置
- 下一篇:3D建模方法及其系统、电子设备