[发明专利]基于排序学习技术的热门事件排名方法无效
申请号: | 201210560212.6 | 申请日: | 2012-12-20 |
公开(公告)号: | CN103077190A | 公开(公告)日: | 2013-05-01 |
发明(设计)人: | 黄丛蕊;薛飞;付万宇;杨之光;杨青 | 申请(专利权)人: | 人民搜索网络股份公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 刘淑敏 |
地址: | 100020 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 排序 学习 技术 热门 事件 排名 方法 | ||
1.一种基于排序学习技术的热门事件排名方法,其特征在于,该方法包括:
A、在线上抓取新闻网页,通过聚类处理将新闻网页映射为事件的步骤;
B、为每个事件提取排名所需的各种特征项的步骤;通过特征提取,获得与新闻事件相关的各项特征,为计算模型做输入准备;
C、收集训练数据,并标注事件热度的步骤;
D、利用排序学习中的Pairwise方法训练出事件热度排名模型,利用该模型计算新闻事件的热度得分并存入事件索引,从而得到热门事件的排名信息。
2.根据权利要求1所述的基于排序学习技术的热门事件排名方法,其特征在于,步骤B所述的特征项,主要包括事件中热词的比例、事件新闻数比例、知名媒体新闻比例、知名媒体评论比例、相关微博数量比例以及事件热度得分。
3.根据权利要求2所述的基于排序学习技术的热门事件排名方法,其特征在于,所述事件热度得分hot(d)具体为:
其中:decay(t)为衰减函数,d为当前时刻,ωt为事件在第t个时刻新增的报道量;ωd为事件在当前时刻的报道量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人民搜索网络股份公司,未经人民搜索网络股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210560212.6/1.html,转载请声明来源钻瓜专利网。