[发明专利]一种排序权重更新方法在审
申请号: | 201910927762.9 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110750717A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 季飞;杨晶生 | 申请(专利权)人: | 上海麦克风文化传媒有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9538;G06Q30/06 |
代理公司: | 31337 上海九泽律师事务所 | 代理人: | 周云;卢双双 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 排序权重 曝光 权重 调用 数据库 采集 浏览 后台调用 排序算法 时间衰减 实时采集 属性标签 算法更新 算法计算 特征内容 详细内容 信息储存 减小 加权 算法 拨动 排序 匹配 搜索 更新 配合 | ||
本发明公开了一种排序权重更新方法,涉及排序算法技术领域。本发明包括以下步骤:步骤一、输入需要搜索的物品,提取物品中描述的关键词;步骤二、利用TF‑IDF算法提取物品介绍中的特征内容与属性标签与关键词相匹配;步骤三、根据算法计算出所有物品的排序权重,按照权重从大到小进行初次排序;步骤四、后台调用程序实时采集物品转化率、物品详细内容的浏览量和浏览时间,采集的信息储存至调用数据库中;本发明通过调用数据库中采集的数据,对物品进行实时曝光加权,再配合时间衰减算法更新排序权重,一方面可以增加优质物品的曝光几率,减小数据拨动几率,另一方面,可以增加新物品的曝光权重,从而防止新物品的曝光几率过低。
技术领域
本发明涉及排序算法技术领域,具体为一种排序权重更新方法。
背景技术
综合排序算法指的是一种信息系统输出的计算方法,它根据用户输入、用户特征和当前场景等因素来评估结果跟用户意图的相关性,并根据相关性和重要性对结果进行打分排序,从而返回用户最需要的结果。
目前的综合排序方法通常采用单一特征的排序原理,排序算法中并没有涉及多个特征,单个特征的优劣不能代表排序物品的实际综合表现情况,只考虑特征的短期表现,容易缺乏特征历史的数据,导致特征数据的波动很大,从而导致特征的参考性降低;同时,若特征采用长期的累计值会出现特征的变化很小,综合排行结果长期不变,使得新进物品的曝光几率过低,因此研发一种可以结合多个特征且实时更新的排序方法是本领域技术人员需要解决的技术问题。
发明内容
针对现有技术的不足,本发明提供了一种排序权重更新方法,解决了上述背景技术中提出的问题。
为实现以上目的,本发明通过以下技术方案予以实现:一种排序权重更新方法,包括以下步骤:
步骤一、输入需要搜索的物品,提取物品中描述的关键词;
步骤二、利用TF-IDF算法提取物品介绍中的特征内容与属性标签与关键词相匹配;
步骤三、根据算法计算出所有物品的排序权重,按照权重从大到小进行初次排序;
步骤四、后台调用程序实时采集物品转化率、物品详细内容的浏览量和浏览时间,采集的信息储存至调用数据库中;
步骤五、后天调用程序根据所得物品转化率、物品详细内容的浏览量和浏览时间对所有物品进行重新排序,针对物品转化率高、物品详细内容的浏览量多和浏览时间长的物品进行曝光加权;
步骤六、重新排序后的结果加入时间衰减算法,计算完成后重新跳转至步骤四。
进一步地,所述TF-IDF算法包括以下公式:
需要说明的是,上述公式中分子是关键词在物品特征内容中的出现次数,而分母则是在物品特征内容中所有关键词出现次数之和。
进一步地,所述时间衰减算法包括以下公式:
需要说明的是,统计30天物品关键词出现的数据特征值为day_num,加入时间衰减算法可以避免新物品曝光几率过低。
进一步地,所述特征内容为物品详细页面中的详细内容介绍,所述属性标签为消费者评价体系中出现的高频词汇,所述特征内容与属性标签均通过python爬虫程序从网页中抓取。
进一步地,所述物品转化率包括消费者点击物品链接的转化率、发送询盘的转化率以及购买物品的转化率,所述物品详细内容的浏览量为消费者浏览页面的长度,所述浏览时间为消费者浏览页面的时间长短,通过上述采集内容可以判断物品的质量优劣,需要说明的是,物品包括可生产销售的商品以及商品相关的评测内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海麦克风文化传媒有限公司,未经上海麦克风文化传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910927762.9/2.html,转载请声明来源钻瓜专利网。