[发明专利]一种确定分区意图的方法以及相关设备有效
申请号: | 201811067820.7 | 申请日: | 2018-09-13 |
公开(公告)号: | CN109388693B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 王璐 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06K9/62 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 徐松 |
地址: | 430000 湖北省武汉市东湖开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 分区 意图 方法 以及 相关 设备 | ||
1.一种确定分区意图的方法,其特征在于,包括:
获取目标用户输入的搜索文本;
对所述搜索文本进行预处理以及分词得到搜索词集合;
提取所述搜索词集合的关键词得到关键词集合,所述关键词集合中的关键词的重要性权重值大于第一预设阈值;
计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合,所述关键词集合与所述点击得分集合具有关联关系;
确定所述直播平台中的直播间分区,得到直播间分区集合;
根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合,所述直播间分区得分集合与所述点击得分集合具有关联关系;
根据所述直播间分区得分集合计算所述搜索文本对应的分区得分向量,所述分区得分向量与所述关键词集合具有关联关系;
将所述分区得分向量中大于第二预设阈值的分区得分对应的直播间分区确定为所述目标用户的分区意图;
所述计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合包括:
通过如下公式计算所述关键词集合中的每个关键词对直播平台中的每个直播间的点击得分,得到点击得分集合:
Score(r,qs)=[C(r,qs)+γLastC(r,qs)]T(qs,t,t);
其中,r为所述直播平台中第r个直播间,qs为所述关键词集合中的第s个关键词,Score(r,qs)是所述关键词集合中的第s个关键词qs在所述第r个直播间的点击得分,C(r,qs)为第一预设时段内所述第s个关键词qs下点击所述第r个直播间的次数;
LastC(r,qs)为第二预设时段内所述第s个关键词qs点击所述第r个直播间的次数,所述第二预设时段为所述第s个关键词qs点击所述第r个直播间的点击行为的发生的时间据当前时刻小于时间阈值λ;
γ为所述第二预设时段内所述第s个关键词qs点击所述第r个直播间的点击行为的权重,0<γ<1;
T(qs,t,t)为时间衰减函数;
通过如下公式计算时间衰减函数T(qs,t,t):
其中,β是时间衰减系数,所述β为0到1之间的常数,t为所述第s个关键词所述第一预设时段内初次被点击的时刻据当天的间隔天数,ct(qs)为所述第s个关键词在当天的点击次数。
2.根据权利要求1所述的方法,其特征在于,所述提取所述搜索词集合的关键词得到关键词集合包括:
通过如下公式计算所述搜索词集合的关键词的重要性权重值:
其中,v(i)为所述搜索词集合中第i个关键词的重要性权重值,n为所述搜索词集合中的总词数,ni所述搜索词集合中的第i个关键词出现的频数,Ni为所述直播平台中出现所述第i个关键词的搜索文本数,N为所述直播平台中的所有搜索文本的数量;
将所述搜索词集合的关键词的重要性权重值大于所述第一预设阈值的关键词确定为所述关键词集合。
3.根据权利要求1所述的方法,其特征在于,所述根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到直播间分区得分集合包括:
通过如下公式根据所述点击得分集合计算所述直播间分区集合中的每个直播间分区的得分,得到所述直播间分区得分集合:
其中,Score(r,qs)是所述关键词集合中的第s个关键词qs在所述第r个直播间的点击得分,L为所述直播平台的所有直播间分区的集合,l为所述L中的任意一个直播间分区,lr为所述直播间分区l下所有直播间集合,r为所述直播间分区l的任意一个直播间,d(l,qs)是所述关键词集合中的第s个关键词qs在所述直播间分区l上的直播间分区得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811067820.7/1.html,转载请声明来源钻瓜专利网。