本文来自网易云社区。

数据挖掘软件首推R,它的优点在于函数都给你写好了,你只需要知道参数的形式就行了,有时候即使参数形式不对,R也能“智能地”帮你适应。这种简单的软件适合想要专注于业务的人。

R作为一款用于统计分析和图形化的计算机语言及分析工具,为了保证性能,其核心计算模块是用C、C++和Fortran编写的。同时为了便于使用,它提供了一种脚本语言,即R语言。R支持一系列分析技术,包括统计检验、预测建模、数据可视化等等。

R软件的首选界面是命令性界面,通过编写脚本来调用分析功能。如果缺乏编程技能,也可使用图形界面,比如使用R Commander。

其次是Python,Python几乎都可以做(通用性语言),函数比R多,比R快。但是缺点是比R难学一点。它是一门语言,R更像是一种软件,所以python更能开发出flexible的算法。它的语言简单易懂,做分析方便,而且可以开发大型软件。

其它数据挖掘软件用的并不是很多,但是可以结合知友的回答推荐几款,常用的数据挖掘软件还是有很多的,各有千秋。

  • SAS Data Mining:

发掘数据集的模式,其描述性和预测性模型为用户更深入的理解数据提供了基础。用户不需要写任何代码,它们提供易于使用的GUI,并提供从数据处理、集群到最终环节的自动化工具,用户可以从中得出最佳结果做出正确决策。

  • WEKA:

一款非常复杂的数据挖掘工具,也可能是名气最大的开源机器学习和数据挖掘软件。其原生的非Java版本主要是为了分析农业领域数据而开发的。该工具基于Java版本,支持多种标准数据挖掘任务,包括数据预处理、收集、分类、回归分析、可视化和特征选取。高级用户可以通过Java编程和命令行来调用其分析组件。同时,Weka也为普通用户提供了图形化界面。

同时它还支持几种经典的数据挖掘任务,显著的数据预处理,集群,分类,回归,虚拟化,以及功能选择。其技术基于假设数据是以一种单个文件或关联的,每个数据点都被许多属性标注。 Weka 使用Java的数据库链接能力可以访问SQL数据库,并可以处理一个数据库的查询结果。高级用户可以通过Java编程和命令行来调用其分析组件。同时,Weka也为普通用户提供了图形化界面。和R相比,Weka在统计分析方面较弱,但在机器学习方面要强得多。

  • Software – R:

R软件是另一种较为流行的GNU开源数据挖掘工具,它主要是由C语言和FORTRAN语言编写的,是一款针对编程语言和软件环境进行统计计算和制图的免费软件。除了可以为科学家、研究人员以及学生提供数据挖掘和分析功能外,它还可以提供统计和制图技术,包括线性和非线性建模,经典的统计测试,时间序列分析、分类、收集等等。

  • NLTK:

NLTK(Natural Language Tool Kit)最适用于语言处理任务,因为它可以提供一个语言处理工具,包括数据挖掘、机器学习、数据抓取、情感分析等各种语言处理任务。而您需要做的只是安装NLTK,然后将一个包拖拽到您最喜爱的任务中,您就可以去做其他事了。因为它是用Python语言编写的,你可以在上面建立应用,还可以自定义它的小任务。

  • RapidMiner:

最受欢迎的免费数据挖掘工具之一,它是一个开源的数据挖掘软件,由Java语言编写而成,提供一些可扩展的数据分析挖掘算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。该款工具最大的好处就是,用户无需写任何代码。它是作为一个服务提供,而不是一款本地软件。

另一方面,它提供的实验由大量的算子组成,而这些算子由详细的XML 文件记录,并被RapidMiner图形化的用户接口表现出来。RapidMiner为主要的机器学习过程提供了超过500个算子,并且,其结合了学习方案和Weka学习环境的属性评估器。它是一个独立的工具可以用来做数据分析,同样也是一个数据挖掘引擎可以用来集成到你的产品中。

  • KNIME

一款基于Eclipse开发环境来精心开发的数据挖掘工具。无需安装,方便使用。用Java语言开的一款开源的数据分析、报告和综合平台,拥有数据提取、集成,处理,分析、转换以及加载所需的所有数据挖掘工具。此外,它具有图形用户界面,可以扩展使用Weka中的挖掘算法。KNIME采用的是类似数据流(data flow)的方式来建立分析挖掘流程。挖掘流程由一系列功能节点(node)组成,每个节点有输入/输出端口(port),用于接收数据或模型、导出结果。可以帮助用户轻松连接节点进行数据处理。

  • Orange数据挖掘软件:

Orange是一个开源数据挖掘和机器学习工具,它的图形环境称为Orange画布(OrangeCanvas),用户可以在画布上放置分析控件 (widget),然后把控件连接起来即可组成挖掘流程。这里的控件和KNIME中的节点是类似的概念。每个控件执行特定的功能,但与KNIME中的节点不同,KNIME节点的输入输出分为两种类型(模型和数据),而Orange的控件间可以传递多种不同的信号。Orange的控件不象KNIME的节点分得那么细,也就是说要完成同样的分析挖掘任务,在Orange里使用的控件数量可以比KNIME中的节点数少一些。Orange的好处是使用更简单一些,但缺点是控制能力要比KNIME弱。

除了界面友好易于使用的优点,Orange的强项在于提供了大量可视化方法,可以对数据和模型进行多种图形化展示,并能智能搜索合适的可视化形式,支持对数据的交互式探索。

此外,它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。Orange的弱项在于传统统计分析能力不强,不支持统计检验,报表能力也有限。Orange的底层核心也是采用C++编写,同时允许用户使用Python脚本语言来进行扩展开发。

在使用数据挖掘软件/软件包的过程中,若能结合大数据分析处理平台,

并能将经常使用的软件包嵌入其中,分析处理数据必会事倍功半。

网易的猛犸大数据平台是一站式的数据开发平台,支持各种常用的数据挖掘软件/软件包,欢迎点击这里免费试用。

常用数据挖掘软件/软件包大盘点相关推荐

  1. 搜索引擎提交工具_钦州SEO优化_SEO工具常用的有哪些大盘点,做SEO优化不再累...

    发布时间:2020-11-06 08:11:48 现在的搜索引擎中,已经有大量的或免费,或付费的seo工具,总的来讲,可以分为几个大类,包括但不限于网站管理员工具,外链查询工具,seo综合查询工具,关 ...

  2. 独立站常用建站工具大盘点——附收款方式及优惠

    独立站常用建站工具大盘点--附收款方式及优惠 近期,加拿大电商平台 Shopify 宣布与 Tik Tok 建立新的全球合作伙伴关系,进一步投资社交电商,使商家可借助 Tik Tok 的"可 ...

  3. 转载:中国物流软件市场大盘点

    转载:中国物流软件市场大盘点 (2010-01-13 13:15:21) 看到这篇文章发布时间最早是2008.2.10 简单看完以后,又仔细看了一遍,觉得放到今天也能看.内容如下: 我国物流软件的现状 ...

  4. 《IBM SPSS Modeler数据与文本挖掘实战》之常用数据挖掘软件

    根据数据挖掘软件的开发目的和用途,一般可以分为专业型和通用型两种.专业型数据挖掘软件一般是针对某个特定领域的问题提供解决方案,在设计算法的时候充分考虑到数据的规模.类型以及研究者的需求等特点,并作了优 ...

  5. 干货丨Python常用的1000+库大盘点

    Python常用库 Chardet字符编码探测器,可以自动检测文本.网页.xml的编码. colorama主要用来给文本添加各种颜色,并且非常简单易用. Prettytable主要用于在终端或浏览器端 ...

  6. 中国物流软件市场大盘点

    我国物流软件的现状如何,整个市场的发展前景怎样,用户对什么样的物流软件更为青睐,计世资讯近期对这个市场进行了深入的调研,结果表明物流软件市场-- 根据中国物流与采购联合会统计,2001年中国与物流相关 ...

  7. 观2007年中常用软件大盘点 一文后的个人软件盘点

    2007年国内国外共享/免费/商业软件的战火不断,收购和并购的消息也不停息,在2007即将结束的日子里,西部e网的牛X编辑重拳出击,将各类软件一一分析推荐给大家,希望大家能够在选择常用装机软件的时候有 ...

  8. 五款服装类进销存软件大盘点,各类排名教你如何挑选

    目前市场上的进销存软件非常之多,用户很容易选择困难.但其实很多进销存软件是分用途的,比如有些是服装类常用的,有些针对的是一些生产型企业.这次带来的就是服装类进销存软件大盘点,相较于其他行业,服装类进销 ...

  9. mysql日期加一天的公式_2020国考行测冲刺指导:数学运算常用公式大盘点

    2020国考行测冲刺指导:数学运算常用公式大盘点 (2020国家公务员考试尚未开始,参考2019国考) 1.奇偶性 加减规律:同奇同偶则为偶,一奇一偶则为奇. 偶数 +奇数=奇数 奇数+奇数=偶数 偶 ...

最新文章

  1. jmeter全链路压测
  2. MySQL8小时连接超时断开问题
  3. C++ stl 通用算法和成员函数使用
  4. 答应我不要问TCP三次握手四次挥手
  5. SQL点滴9—使用with语句来写一个稍微复杂sql语句
  6. 关于结构化伪类的案例
  7. java 从已知日期计算干支纪日_两个日期计算
  8. stringWithUTF8String return null (返回null)的解决办法
  9. 【架构】Heartbeat高可用服务(2)
  10. 如何在 Linux 上检查可用磁盘空间 [终端和 GUI]
  11. javascript设计模式之发布订阅模式
  12. 2021数据库课程设计培训笔记:【jdbc】部分
  13. c语言图形格式输出,C语言输出图形9个.doc
  14. C# QQ群管理机器人
  15. C#做一年小孩做一个口算题生成器
  16. 史上最全各种简历模板,自荐信模板和面试技巧
  17. hp服务器 iLO远程管理 python api模块 hpilo-python 接口列表
  18. 依赖注入与pimple
  19. 安卓高德地图 - (附近信息点Poi与标记Marker2)
  20. ThinkPHP 微信支付及退款

热门文章

  1. 机器学习中常见的损失函数及其应用场景
  2. pythontkinter窗口外观样式_Python GUI之tkinter窗口视窗教程大集合(推荐)
  3. 微信公众号提示 :该公众号提供的服务出现故障,请稍后再试
  4. 用Python大声说出“我爱你”
  5. unity3d 切换网络_【Unity3D入门教程】网络通信
  6. 你怎么过一天,就是怎么过一辈子
  7. 动态修改ntp服务器,修改时区和建立ntp服务器
  8. 生成全球定位系统、伽利略和北斗二号的Matlab代码及实际数据捕获文件,为测试功能提供完整信号与频谱
  9. 提升hoisting
  10. 晨哥真有料丨你从相识到在一起,有恋爱的体验嘛?/ 不能在一起的恋爱还有必要谈下去吗?