[发明专利]一种通用型互联网信息数据挖掘方法有效

专利信息
申请号: 201410180219.4 申请日: 2014-05-01
公开(公告)号: CN103970848A 公开(公告)日: 2014-08-06
发明(设计)人: 刘莎 申请(专利权)人: 刘莎
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 400041 重庆市九*** 国省代码: 重庆;85
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 通用型 互联网 信息 数据 挖掘 方法
【权利要求书】:

1.本发明提供一种通用型互联网信息数据挖掘方法,其具体步骤如下:

输出数据挖掘人机交互模板,

从数据挖掘人机交互模板中的挖掘需求关键词输入模板中获得数据挖掘中的主题关键词、语用关键词、语用关键词项下的普通关键词,

从数据挖掘人机交互模板中的相关挖掘需求选择栏中获得用户选择的相关需求,以及直接输入的特殊需求,

获得“数据挖掘”操作指令,并根据获得的数据挖掘需求关键词以及获得的用户选择的挖掘需求,对互联网信息进行数据挖掘操作,

将数据挖掘结果输出给相关需求方。

2.权利要求1中所述的数据挖掘人机交互模板中预设有挖掘需求关键词输入模板、相关挖掘需求选择项,以及挖掘需求自由输入框;

其中,所述的数据挖掘人机交互模板中的挖掘需求关键词输入模板中预设有任意主题关键词输入框、任意主题关键词常用顶层及下层语用关键词的分类集成、数据形式分类,以及挖掘需求关键词输入模板使用方法说明;

其中,所述的任意主题关键词常用顶层及下层摘要结构标签的分类集成结果的产生方法可以与发布通用型互联网信息发布系统中的互联网信息通用摘要数据库结构标签的产生方法一致;

其中,所述的从数据挖掘人机交互模板的相关挖掘需求选择项中获得用户选择的相关需求可包括时间、空间、地域、数据来源等多种数据挖掘范围选择;

其中,所述的对互联网信息“进行数据挖掘操作”中的挖掘对象可包括但不限于本发明所述通用型互联网信息发布系统中存储的结构化信息、半结构化信息、相关详细信息、可链接的其它网站信息,以及通过中国发明专利《一种语用关键词检索方法与装置》(发明专利申请号CN 102880632 A)中所述方法获得的网页信息全文关键词检索结果;

其中,所述的数据挖掘操作中的数据检索,是指用数据挖掘人机交互模板的关键词获取模板中获得的用户输入的所需挖掘信息的主题关键词、用户选择的语用关键词、语用关键词选择项下的普通关键词或组合结果对包括本发明所述通用型互联网信息发布系统中的相关信息及各类互联网信息进行检索;

其中,所述的数据挖掘操作包括但不限于数据检索、统计、抽取、分析和相关模型化自动处理,以及根据用户需求对信息挖掘结果的自动整理;

其中,所述的数据挖掘操作中的数据统计包括但不限于发布信息量统计、检索信息量统计、主题关键词、语用关键词、普通关键词的相关性统计、点击量统计;

其中,所述的数据挖掘操作中的数据分析包括但不限于历史数据演变分析、数据关联分析、未来趋势分析;

其中,如果用户自由输入的数据挖掘特殊需求需要进行挖掘方案人工设计,则在人工设计或调整挖掘方案基础上进行数据挖掘。

3.权利要求2中所述的通用型互联网信息发布系统,具有下述特征:

统计分析互联网信息任意主题关键词的常用顶层及下层摘要结构标签及分类集成结果,

获得上述结果,自动生成包括详细信息链接地址的互联网信息通用摘要数据库结构标签和信息发布通用模板,

在信息发布通用模板上获得由用户自主添加的适用于互联网信息任意主题关键词的顶层及下层摘要结构标签,

根据系统用户使用频率自动调整互联网信息通用摘要数据库及信息发布通用模板结构标签,并用户自主添加的结构标签保留在该用户独立使用的摘要结构标签中;

获得用户的调用信息发布模版指令,输出预设有上述任意主题关键词常用顶层及下层摘要结构标签的互联网信息发布通用模板,

在该模板上获得用户输入的结构化信息摘要和“其它”类、项下的非结构化摘要,以及获得其他网站中结构化信息标签与本系统摘要结构标签已建立映射关系的结构化摘要发布信息和非结构化摘要发布信息,

在该模板中获得摘要信息发布后的用户上传详细信息,或,

将本系统摘要结构标签自动或人工添加至上传详细信息或系统外网页信息全文关键词搜索的叙词表中;

获得信息存储指令,将获得的摘要信息存储在本系统的通用摘要信息存储数据库,将获得的详细信息存储于本系统的详细信息分类存储数据库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘莎,未经刘莎许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410180219.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top