[发明专利]热点信息分析方法及设备有效
申请号: | 201410283286.9 | 申请日: | 2014-06-23 |
公开(公告)号: | CN104063450B | 公开(公告)日: | 2018-04-03 |
发明(设计)人: | 王晓元;陈承泽;裘皓萍;王杨;汤金华 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙)11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 热点 信息 分析 方法 设备 | ||
【技术领域】
本发明涉及互联网技术领域,尤其涉及一种热点信息分析方法及设备。
【背景技术】
随着业务市场的发展,越来越多的业务行业需要进行热点信息挖掘,以便进行行业分析或者获取有用的信息。以证券市场为例,证券市场中的热点行情是此起彼伏。现阶段,股民用户主要是基于自己了解到的股票的市场交易数据和消息面数据,凭借业务经验进行判断和分析,以获得证券市场中的热点信息。目前这种分析热点信息的方法一方面依赖于用户的业务经验,另一方面使用用户所能了解到的数据,数据量相对较少,导致分析出的热点信息的准确度较低。
【发明内容】
本发明的多个方面提供一种热点信息分析方法及设备,用以进行热点信息的分析,提高分析出的热点信息的准确度。
本发明的一方面,提供一种热点信息分析方法,包括:
从互联网数据中提取描述热点事件的热点数据;
对整个业务市场中与业务交易有关的业务数据与所述热点数据进行关联分析,获得候选热点数据与候选业务数据的对应关系,所述候选热点数据是指所述热点数据中与业务交易有关的热点数据,所述候选业务数据是指所述业务数据中与热点事件有关的业务数据;
根据所述候选热点数据与候选业务数据的对应关系,对所述候选热点数据进行合并处理,获得目标热点数据和所述目标热点数据对应的目标业务数据。
作为本发明的进一步改进,所述从互联网数据中提取描述当天热点事件的热点数据,包括:
从所述互联网数据中确定用户访问数据;
从所述用户访问数据中确定均值突变率大于第一突变率门限且短期突变率大于第二突变率门限的候选用户访问数据;
对所述候选用户访问数据的真实性进行验证,将通过真实性验证的所述候选用户访问数据作为描述热点事件的所述热点数据;
其中,所述均值突变率用于表征所述用户访问数据从第一时间点到当前一段时间内的访问量的变化趋势;所述短期突变率用于表征所述用户访问数据自第二时间点到当前一段时间内的访问量的变化趋势,所述第一时间点早于所述第二时间点。
作为本发明的进一步改进,所述从所述用户访问数据中确定均值突变率大于第一突变率门限且短期突变率大于第二突变率门限的候选用户访问数据之前,还包括:
获取所述用户访问数据自所述第一时间点到当前的第一平均访问量、所述用户访问数据自所述第二时间点到当前的第二平均访问量、以及所述用户访问数据当前的访问量;
用所述用户访问数据当前的访问量除以所述第一平均访问量,获得所述均值突变率;
用所述用户访问数据当前的访问量除以所述第二平均访问量,获得短期突变率。
作为本发明的进一步改进,所述对所述候选用户访问数据的真实性进行验证,包括:
判断所述候选用户访问数据是否出现在新闻标题的切词片段中;
如果判断结果为是,确定所述候选用户访问数据通过真实性验证;如果判断结果为否,确定所述候选用户访问数据未通过真实性验证。
作为本发明的进一步改进,所述对整个业务市场中与业务交易有关的业务数据与所述热点数据进行关联分析,获得候选热点数据与候选业务数据的对应关系,包括:
对于每种所述业务数据,确定所述业务数据对应的价格走势和每个所述热点数据对应的访问量走势之间的相似度,并确定所述业务数据对应的关键词在每个所述热点数据所属的用户访问数据中的共现次数,如果存在相似度满足预设的相似度条件、且共现次数大于预设的共现量门限的热点数据,则建立所述业务数据和所述存在的热点数据之间的对应关系,并确定所述业务数据和所述存在的热点数据分别作为所述候选业务数据和所述候选热点数据。
作为本发明的进一步改进,所述根据所述候选热点数据与候选业务数据的对应关系,对所述候选热点数据进行合并处理,获得目标热点数据和所述目标热点数据对应的目标业务数据,包括:
根据所述候选热点数据与候选业务数据的对应关系,确定每个所述候选热点数据对应的候选业务数据;
将所述候选热点数据两两进行比较,以判断每两个所述候选热点数据对应的候选业务数据中是否存在相同的候选业务数据且所述相同的候选业务数据的数量满足预设的重叠条件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410283286.9/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置