http://xiaogao39.blog.163.com/blog/static/7285602200910395121696/

Weka全名为怀卡托智能分析环境(WaikatoEnviron-meritforKnowledgeAnalysis),是一个基于java、用于数据挖掘和知识发现的开源项目,其开发者是来自新西兰怀卡托大学的IanH.Witten和EibeFrank。经过12年的发展历程,Weka是现今最完备的数据挖掘工具之一,而且被公认为是数据挖掘开源项目中最著名的一个,每月下载次数已超过万次。 和其他数据挖掘工具的艰深复杂不同,Weka使数据挖掘轻松易行,无需编程也能轻松实现:它提供了统一的用户界面,可在任何数据集上应用各种预处理和数据挖掘算法,同时还提供了数据可视化工具。介绍Weka的使用方法。  

运行Weka软件,有四种不同的界面供您选择:SimpleCLI、Explorer、Experimenter、KnowledgeFlow。 

     (1)SimpleCLI:能通过键入文本命令的方式来实现其他三个用户界面所提供的所有功能。  

(2)Explorer:是普通用户最常用的一个界面。用户可以从ARFF文件(Weka使用的一种文本文件格式)、网页或数据库中读取数据集。打开数据文件后,可以选择算法对数据进行预处理。这时窗体上给出了这个数据集的一些基本特征,如含有多少属性,各属性的一些简单统计量,右下方还给出一些可视化效果图。这些都是比较直观的分析,如果想发现隐藏在数据集背后的关系,还需要选择Weka提供的各种分类、聚类或关联规则的算法。所有设置完成后,点击Start按钮,就可以安心地等待weka带来最终的结果。哪些结果是真正有用的还要靠经验来判断。  

(3)Experimenter:这个界面可以同时使用多个算法对一组(或多组)数据进行分析,对各种算法分析的结果进行比较并从中选出最佳,还可以使用Experimenter把一项任务分割成多个子项,每个子项可以在单独的计算机上执行,从而大大加快了分析进程。  

(4)KnowledgeFlow:Explore的不足在于,当用户打开一个数据集时,所有数据将全部被读入到主存当中,随着任务规模的增大,普通配置的计算机很难满足要求。KnowledgeFlow提供了一个用于处理大型数据集的递增算法,专门处理这一问题。可以在KnowledgeFlow界面的工具条中拖动任意部件(代表数据源、预处理工具、数据挖掘算法、评估手段或可视化模块)放置在画布中,这些部件组合在一起形成一个数据流,当您选择有递增学习功能的过滤器和数据挖掘算法后,大型数据集就可以被分批读取和处理。   

  由于Weka的开源、易操作等优点,可供各类人群学习、使用。如果是一位数据挖掘算法的研究者,可以把自己的算法放在这个平台上,然后从海量数据中发掘其背后隐藏的种种关系。如果是数据挖掘的初学者,这是最好的学习平台,它不但简单易学,还提供了八个数据挖掘、统计学上的经典案例供您参考;如果在工作中有大量的数据需要分析,Weka也许能帮您发现更大的商机。  

注:Weka的最新版本是3.5:weka-3-5-3jre.exe(30.7M,带ire)和weka-3-5-3.exe(12.5M);  

应用平台:Windows、Linux和Macintosh操作系统;  

下载地址:http://www.cs.waikato.ac.nz/ml/weka。

数据挖掘工具weka使用相关推荐

  1. java weka 聚类_简单开源数据挖掘工具weka进行文本聚类

    目前非代码的数据挖掘工具很多,但非开源,weka是一款开源软件.只要安装jdk环境就可使用(具体安装jdk可以百度) 本文将论述如何不用代码,使用weka操作,通过与文档频数与单词权的特征选择方法进行 ...

  2. 开始研究WEKA,一个开源java的数据挖掘工具

    开始研究WEKA,一个开源java的数据挖掘工具. HS沉寂这么多天,谁知道偏偏在我申请离职的时候给我安排了个任务,哎,无语. 于是,今天看了一天的Weka. 主要是看了HS提供的三个文章(E文,在g ...

  3. 几款开源的数据挖掘工具

    from: http://blog.csdn.net/u010140338/article/details/17454085 come from:http://idmer.blog.sohu.com/ ...

  4. 7款优秀的开源数据挖掘工具

    7款优秀的开源数据挖掘工具   IDMer说道:本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等.如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directo ...

  5. java 数据挖掘 开源_5个开源数据挖掘工具,收下这波干货

    数据挖掘是从大量数据中提取隐藏的或未知,但可能有用信息的过程.尤其在机器学习中,数据挖掘是十分重要的一环.今天给大家介绍5个开源数据挖掘工具,收下这波干货吧. 1. Orange Orange 是由C ...

  6. python 数据挖掘工具_推荐19款最常用的数据挖掘工具

    数据在当今世界意味着金钱.随着向基于app的世界的过渡,数据呈指数增长.然而,大多数数据是非结构化的,因此需要一个过程和方法从数据中提取有用的信息,并将其转换为可理解的和可用的形式. 数据挖掘或&qu ...

  7. 工具推荐 | 分析大数据最需要的Top 10数据挖掘工具

    点击查看全文 本文讲的是 工具推荐 | 分析大数据最需要的Top 10数据挖掘工具, 首先,我们要了解什么是数据挖掘?官方提供的定义如下:数据挖掘又称为资料探勘.数据采矿.它是数据库知识发现(Know ...

  8. 推荐:几款优秀的数据挖掘工具

    [b]TipDM数据挖掘建模工具[/b] 一.产品简介: 顶尖数据挖掘平台(TipDM)是广州泰迪智能科技有限公司自主研发的一个数据挖掘工具,使用JAVA语言开发,能从各种数据源获取数据,建立各种不同 ...

  9. 几款优秀的开源数据挖掘工具

    几款优秀的开源数据挖掘工具 By kevinwu on December 28, 2008 2:39 AM | No Comments | No TrackBacks 本文只对几种流行的开源数据挖掘平 ...

最新文章

  1. Tails 3.13 发布,更新 Intel 微码,改进拼音输入法支持
  2. 上升沿_为什么示波器上升时间 Tr=0.35/BW ?
  3. LeetCode-两个结构分别遍历,然后合并
  4. 1821: 入学考试(1261采药)01背包
  5. 【数据结构与算法】之深入解析“排列序列”的求解思路与算法示例
  6. load data详解
  7. c语言 函数的参数传递示例_C语言中带有示例的remove()函数
  8. LeetCode MySQL 262. 行程和用户
  9. 简述计算机图形的图形应用主要有哪些,5计算机图形学考试简答题复习.doc
  10. centos usb转网口_CentOS5.6系统中安装并使用USB无线网卡(配置成功) 转
  11. 挖一挖产品经理的核心竞争力
  12. java 注解入门 简书_Java基础-注解
  13. 什么是编译器(编程软件)?
  14. 深度桌面操作系统架构设计
  15. 整蛊系列——使小伙伴的电脑自动关机
  16. rest assured
  17. 交换机级联后网速在底层交换机变慢的问题
  18. OCM_第二天课程:Section1 —》配置 Oracle 网络环境
  19. 首个Nginx windows Stable 版--轻量级Web服务器Nginx 0.7.59
  20. C#实现邮箱发送的多种方式

热门文章

  1. 【数据结构与算法】之深入解析“序列化和反序列化二叉搜索树”的求解思路与算法示例
  2. 【数据结构与算法】之深入解析“两数相除”的求解思路与算法示例
  3. 【数据结构与算法】之深入解析“组合总和”的求解思路与算法示例
  4. 【数据结构与算法】之电话号码键盘的字母组合算法
  5. 529. Minesweeper
  6. 做人工智能必看的 45 篇论文,附下载地址 | 文末有彩蛋
  7. ZYAR20A 亚克力2驱 蓝牙 298寻迹避障机器人 —— 小车超声波避障实验(有舵机)
  8. Linux (七) 网络
  9. 【计算机类】大学生计算机专业电子书汇总
  10. 【Linux网络编程】TCP