[发明专利]一种排序方法、装置、计算机设备和存储介质在审
申请号: | 202110814492.8 | 申请日: | 2021-07-19 |
公开(公告)号: | CN113688280A | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 谭又伟;李泽隆 | 申请(专利权)人: | 广州荔支网络技术有限公司 |
主分类号: | G06F16/732 | 分类号: | G06F16/732;G06F16/783 |
代理公司: | 广州佳睿知识产权代理事务所(普通合伙) 44610 | 代理人: | 李健富 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 排序 方法 装置 计算机 设备 存储 介质 | ||
1.一种排序方法,其特征在于,包括:
接收检索用户发起的声音数据检索请求;
针对所述检索请求,获取所述检索用户的检索词;
获取针对所述检索词的检索结果声音数据;
根据所述检索用户对所述检索结果声音数据的操作信息,生成检索节点数据;所述操作信息包括所述检索用户的用户信息以及所点击的所述检索结果声音数据的特征信息;
将所述检索节点数据转换为检索词特征向量、用户信息特征向量以及检索结果声音数据特征向量;
获取所述检索词特征向量、所述用户信息特征向量与所述检索结果声音数据的相关特征匹配度;
将所述检索词特征向量、所述用户信息特征向量、所述检索结果声音数据以及所述相关特征匹配度输入梯度提升决策树模型,输出所述检索结果声音数据的排序结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述检索用户对所述检索结果声音数据的操作信息,生成检索节点数据,包括:
获取在预设操作时间内所述检索用户对所述检索结果声音数据的操作数据;
获取所述检索结果声音数据的标题、声音唯一标识、主播信息、标签、声音关键词以及声音文本数据;
分别对所述检索词和所述检索结果声音数据的标题进行分词操作,得到检索分词结果和声音标题分词结果;
将所述检索用户的用户信息、所述检索词分词结果、所述声音标题分词结果、所述声音唯一标识、所述主播信息、所述标签以及所述声音关键词合并生成检索节点数据。
3.根据权利要求2所述的方法,其特征在于,所述将所述检索节点数据转换为检索词特征向量、用户信息特征向量以及检索结果声音数据特征向量,包括:
将所述检索节点数据输入到word2vec模型进行训练,输出检索词分词结果特征向量、用户信息特征向量,以及各所述检索结果声音数据的声音唯一标识特征向量、主播信息特征向量、标签特征向量、声音文本数据特征向量。
4.根据权利要求3所述的方法,其特征在于,所述获取所述检索词特征向量、所述用户信息特征向量与所述检索结果声音数据的相关特征匹配度,包括:
通过对所述检索词特征向量预处理,得到预处理检索词特征向量;
确定所述预处理检索词特征向量的加权平均值为检索词表达式;
通过所述用户信息特征向量获取用户信息表达式;
获取所述检索词表达式、所述用户信息表达式、所述声音唯一标识特征向量、主播信息特征向量、标签特征向量以及声音文本数据特征向量之间的相关特征匹配度。
5.根据权利要求4所述的方法,其特征在于,所述通过所述用户信息特征向量获取用户信息表达式,包括:
计算所述检索节点数据中各所述检索结果声音数据的各所述声音唯一标识特征向量的平均值,得到第一检索节点表达式;
计算所述检索节点数据中各所述检索结果声音数据的各所述主播信息特征向量的平均值,得到第二检索节点表达式;
根据所述第一检索节点表达式与第一预设权重的乘积,得到第一权重检索节点表达式;
根据所述第二检索节点表达式与第二预设权重的乘积,得到第二权重检索节点表达式;
根据所述检索词表达式与第三预设权重的乘积,得到权重检索词表达式;所述第一预设权重、所述第二预设权重与所述第三预设权重的和为1;
将所述第一权重检索节点表达式、所述第一权重检索节点表达式以及所述权重检索词表达式求和,得到用户信息表达式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州荔支网络技术有限公司,未经广州荔支网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110814492.8/1.html,转载请声明来源钻瓜专利网。