转自:http://www.jdon.com/bigdata/java-machine-learning.html

编写程序是最好的学习机器学习的方法。你可以从头开始编写算法,但是如果你要取得更多的进展,建议你采用现有的开源库。在这篇文章中你会发现有关Java中机器学习的主要平台和开放源码库包。

环境

本节描述可用于机器学习的java环境或工作台。他们被称为环境,因为他们为执行机器学习任务提供了图形用户界面,但也提供了Java api供使用者开发自己的应用程序。

Weka

Waikato Environment for Knowledge Analysis (Weka) 是一个机器学习的平台开发,由新西兰的怀卡托大学用Java编写的。提供一个图形用户界面,命令行界面和Java API。这可能是最流行的Java机器学习库和最好的开始机器学习或实践的起点。

KNIME

Konstanz Information Miner (KIME) 是一个德国康斯坦茨大学开发的分析和报告平台。它是关注医药研究开发的,但可扩展到一般商业智能。它提供了一个图形用户界面(基于Eclipse)和Java API。

RapidMiner

RapidMiner 在过去被称为另一个学习环境(YALE),是由德国多特蒙德大学开发的技术。它提供了一个GUI和Java API来开发自己的应用程序。它提供了数据处理、可视化建模和机器学习算法。

ELKI

Environment for DeveLoping KDD-Applications Supported by Index-Structures (ELKI) 是一个Java开发的数据挖掘工作台,由德国慕尼黑大学开发。它有一个专注于处理关系数据库的数据,用于异常值检测和分类(基于距离函数的方法)。它提供了一个迷你GUI,命令行接口和Java API。

库包

下面是机器学习的库包,它们都有Java API,提供器学习在某个方面成就。

Java-ML

Java Machine Learning Library (Java-ML) 提供了一个用Java实现机器学习算法的集合。每个算法它都提供了一个标准接口,但是没有ui,没有相关引用以便进一步阅读相关的科学文献。它包括数据操作方法、聚类、特征选择和分类。

JSTAT

Java Statistical Analysis Tool (JSTAT) 提供了标准的纯Java实现机器学习算法,包括small-ish问题。作者承认开发这个库包是为了自己修炼学习。然而算法列表令人印象深刻。它包括分类、回归、合奏、集群和特征选择方法。

大数据

Mahout (Hadoop)

Apache Mahout提供了在Apache Hadoop平台上(分布式使用map-reduce模式)使用机器学习算法的实现。这个项目提供了一个专注于聚类和分类算法和一个受欢迎的应用程序驱动实现,其针对推荐系统使用协同过滤。

MLlib (Spark)

Apache Mchine Learning Library提供了用于Apache Spark的平台(HDFS,但不是使用Map-reuce模式)实现的机器学习算法。支持Java平台,Scala和Python绑定。库包是很新,算法的列表也很短,但发展迅速。

MOA

Massive Online Analysis (MOA) 是一个新西兰怀卡托大学为数据流挖掘开发的开源的平台设计。某些地方像Weka,它提供了一个GUI,命令行接口和Java API。它提供了一长串的算法着重分类和支持异常值检测和解决概念漂移。MOA使用Advanced Data mining And Machine learning System (ADAMS) 作为管理工作流。

SAMOA

Scalable Advanced Massive Online Analysis (SAMOA) 是一个由雅虎开发的分布式流媒体机器学习框架。它被设计为运行在Apache Storm 风暴和Apache S4上。系统可以利用MOA 所提供的算法如分类等任务。

自然语言处理

本节是关于从机器学习的分支称为自然语言处理(NLP)的Java库和项目。

  • OpenNLP: Apache OpenNLP 是一个处理自然语言文本的工具包。它提供了NLP等任务的方法,如标记 分割和实体提取。
  • LingPipe: LingPipe是计算语言学的工具包,包括主题分类方法、实体提取、聚类和情感分析。.
  • GATE: The General Architecture for Text Engineering (GATE) 是一个用于文本处理开源库。它针对不同的用例提供了一系列子项目。
  • MALLET: Machine Learning for Language Toolkit (MALLET) 是一个Java工具包统计自然语言处理,文档分类、聚类、主题建模和信息提取。

Computer Vision(CV)

  • BoofCV: BoofCV是一个开源库用于计算机视觉和机器人应用程序。它支持功能,如图像处理,特征,几何愿景、校准、识别和图像数据

Deep Learning深度学习

本节列出使用神经网络和深入学习的关键Java库.

  • Encog: Encog 是一个机器学习库提供算法支持向量机等古典神经网络,遗传编程,贝叶斯网络,嗯,遗传算法
  • Deeplearning4j: Deeplearning4j 声称是用Java编写的商用深度学习图书馆。它被描述为兼容Hadoop并提供算法包括限制玻耳兹曼机,deep-belief网络和Stacked Denoising Autoencoders(SdA)。

Java机器学习软件介绍相关推荐

  1. JAVA 开发相关软件介绍以及安装使用教程(初学者一定要收藏)

    想要做Java开发,就需要掌握一定的Java技术.在学习过程中总会需要学到Java相关软件,今天就来给大家介绍一下Java开发必装的几个好用软件,以及详细的安装使用教程,学起来吧! 第一.JDK 8 ...

  2. Java程序员常用开发软件介绍

    Java程序员常用开发软件介绍 Java程序员常用开发软件介绍 后端开发利器:idea / eclipse及各种封装版本 数据库客户端:Navicat / Heidisql 前端开发: vs code ...

  3. 机器学习java_如何开始使用Java机器学习

    机器学习java 什么是开始使用Java机器学习的最佳工具? 他们已经存在了一段时间,但如今看来,每个人都在谈论人工智能和机器学习. 对于科学家和研究人员而言,它已经不再是秘密,几乎可以在任何新兴技术 ...

  4. 京东智能供应链决策引擎全面开放;LinkedIn开源Dagli,发布Java机器学习函数库...

    开发者社区技术周刊又和大家见面了,萌妹子主播为您带来最新一期"开发者技术联播".让我们一起听听,过去一周有哪些值得我们开发者关注的重要新闻吧. 京东智能供应链决策引擎全面开放 Li ...

  5. Java语言的介绍,Java环境的配置以及Java编译器的安装

    Java语言的介绍,Java环境的配置以及Java编译器的安装 文章目录 Java语言的介绍,Java环境的配置以及Java编译器的安装 Java 简介 主要特性 关于语言的选择 Python Jav ...

  6. 好用的数据挖掘软件介绍

    好用的数据挖掘软件介绍 WEKA 下载地址: Orange 下载地址: RapidMiner 下载地址: 八爪鱼 下载地址: WEKA WEKA的全名是怀卡托智能分析环境(Waikato Enviro ...

  7. java培训教程分享:Java编写软件代码自动提示功能

    本期的java培训教程分享主要是介绍的java编写软件代码的一个自动提示功能,很多零基础和初学java的同学们对这一块还不是很了解,Eclipse for android 实现代码自动提示智能提示功能 ...

  8. 学Java的软件哪些比较好用

    很多java程序猿在工作的时候都会用一些辅助工具,辅助工具可以很好的帮助程序猿高效率的完成工作,那么具体学Java的软件哪些比较好用呢?来看看下面的详细介绍. 学Java的软件哪些比较好用? 1. E ...

  9. 25个Java机器学习工具库

    本列表总结了25个Java机器学习工具&库: 1. Weka集成了数据挖掘工作的机器学习算法.这些算法可以直接应用于一个数据集上或者你可以自己编写代码来调用.Weka包括一系列的工具,如数据预 ...

  10. 25个Java机器学习工具库--转载

    本列表总结了25个Java机器学习工具&库: 1. Weka集成了数据挖掘工作的机器学习算法.这些算法可以直接应用于一个数据集上或者你可以自己编写代码来调用.Weka包括一系列的工具,如数据预 ...

最新文章

  1. 阿里巴巴开源项目: 基于mysql数据库binlog的增量订阅消费
  2. 十一、H.264的Slice Header解析
  3. HDU 4638 Group(莫队)题解
  4. CompletableFuture详解~创建实例
  5. 一文教你如何使用 MongoDB 和 HATEOAS 创建 REST Web 服务
  6. sysbench的框架实现介绍
  7. java list 去空字符串_从字符串列表中删除空字符串
  8. Prometheus监控学习笔记之PromQL简单示例
  9. paip.提升用户体验---c++ 右键菜单以及socket接口
  10. WMS——新能源汽车减速机组装工厂WMS案例
  11. tomcat 9 http请求中文乱码问题
  12. ESXi主机从6.7升级到ESXi 7.0.3后无法识别Emulex LPe12000 HBA卡
  13. MD5 标准算法详解
  14. SQL基础教程学习第六站:数据更新
  15. 绘画板 java_非常值得学习的java 绘图板源代码
  16. 弘辽科技:直通车如何降低PPC
  17. 史上最严数据保护条例欧盟GDPR今日生效,你可能需要这版中文全文(上)
  18. matlab 缩进快捷键(快捷删掉matlab代码前空格/换行符 批量改/删/加代码前空格)
  19. Leetcode 1774. Closest Dessert Cost 枚举法 vector 中的insert方法
  20. 智能化LED照明技术的最新发展

热门文章

  1. 未经许可,请勿擅自引用本博客内的原创作品
  2. 锁屏对对碰_锁屏应用
  3. 分析:谷歌不会退出中国市场的8大理由
  4. 2021MySql-8.0.26安装详细教程(保姆级)
  5. 如何使用JavaScript替换DOM元素?
  6. 深度学习——卷积神经网络原理解析
  7. ELK---日志收集系统
  8. 多卡聚合路由器在视频可视化指挥调度的解决方案
  9. anguarjs 图片预览_一键精准提取图片文字,这么高效的app确定不盘一下嘛
  10. 在局域网搭建mqtt服务器