[发明专利]一种基于用户阅读兴趣的相关事件生成方法无效
申请号: | 201210568745.9 | 申请日: | 2012-12-24 |
公开(公告)号: | CN103077193A | 公开(公告)日: | 2013-05-01 |
发明(设计)人: | 薛飞;黄丛蕊;付万宇;杨之光;杨青 | 申请(专利权)人: | 人民搜索网络股份公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 刘淑敏 |
地址: | 100020 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 阅读 兴趣 相关 事件 生成 方法 | ||
1.一种基于用户阅读兴趣的相关事件生成方法,其特征在于,该方法包括:
A、对舆情文档进行数据预处理,得到事件的核心子集,并从核心子集中提取事件的核心文档以及事件的关键词列表的步骤;
B、通过所述核心文档的正文对事件进行倒排索引,倒排word的初始权重值为TF-IDF值或Hit Number;后台记录用户点击事件E的时间轴TA和频率CF,并计算得到事件对应关键词的权重因子α(E);
C、对于历史事件集进行人工标注,标注的内容主要包括事件的点击频率CF、时间轴信息TA、该事件作为相关事件的影响因子,通过映射将上述三部分信息即α(E),CF和TA,转化为事件E对应的实数值;
D、通过机器学习的方法,对步骤C中得到的训练数据进行回归运算,获得函数表达式的原型α(E)=m*TA+n*CF,并通过线性回归运算确定参数m和n的值;
E、通过上述函数表达式调整事件关键词在索引中的权重,然后对新事件的相关事件进行检索和展示。
2.根据权利要求1所述基于用户阅读兴趣的相关事件生成方法,其特征在于,步骤B所述事件对应关键词的权重因子α(E):
α(E)=F(TA,CF);其中:α(E)>=1。
3.根据权利要求1所述基于用户阅读兴趣的相关事件生成方法,其特征在于,步骤D所述机器学习的方法,具体为支持向量机SVM法。
4.根据权利要求1所述基于用户阅读兴趣的相关事件生成方法,其特征在于,步骤E所述对新事件的相关事件进行检索和展示,具体为:当某一事件E被用户点击需要展示时,通过调整权重之后的事件关键词检索其相关事件,并且不断重复步骤B的如下过程:对获得的事件核心文档的正文进行倒排索引,倒排word的权重初始值为TF-IDF值或Hit Number。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人民搜索网络股份公司,未经人民搜索网络股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210568745.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:汽车前照灯的调光装置
- 下一篇:云计算管理系统以及云计算系统的管理方法