1、Scikit-learn 用于数据挖掘和数据分析的简单而有效的工具,基于NumPy,SciPy和matplotlib,开源,商业可用的BSD许可证。

Commits: 21486, Contributors: 736, Github地址: Scikit-learn

2、Tensorflow  最初由Google机器智能研究机构的Google Brain小组的研究人员和工程师开发。 该系统旨在促进机器学习的研究,并使其快速和容易地从研究原型过渡到生产系统。

Commits: 10466, Contributors: 493, Github地址: Tensorflow

3、Theano  允许您有效地定义,优化和评估涉及多维数组的数学表达式。

Commits: 24108, Contributors: 263, Github URL: Theano

4、Caffe is一个深入学习的框架,速度快和模块化。 它由伯克利视觉和学习中心(BVLC)和社区贡献者开发。

Commits: 3801, Contributors: 215, Github URL: Caffe

5、Gensim is 一个免费的Python库,具有诸如可扩展的统计语义之类的特性,分析用于语义结构的纯文本文档,从语义上检索类似的文档。

Commits: 2702, Contributors: 145, Github URL: Gensim

6、Pylearn2 是一个机器学习库。 它的大部分功能是建立在Theano的基础之上。 这意味着您可以使用数学表达式编写Pylearn2插件(新模型,算法等),Theano将为您优化和稳定这些表达式,并将其编译为您选择的后端(CPU或GPU)。

Commits: 7100, Contributors: 115, Github URL: Pylearn2

7、Statsmodels 是一个Python模块,允许用户探索数据,估计统计模型和执行统计测试。 描述性统计,统计测试,绘图函数和结果统计的详细列表可用于不同类型的数据和每个估计器。

Commits: 8664, Contributors: 108, Github URL: Statsmodels

8、Shogun是机器学习工具箱,提供广泛的统一和高效的机器学习(ML)方法。 工具箱无缝地允许容易地组合多个数据表示,算法类和通用工具。

Commits: 15172  Contributors: 105, Github URL: Shogun

9、Chainer 一个用于深度学习模型的基于Python的独立开源框架。 Chainer提供灵活,直观和高性能的方法来实现全范围的深度学习模型,包括最先进的模型,如复现神经网络和变分自动编码器。

Commits: 6298, Contributors: 84, Github URL: Chainer

10、NuPIC 是基于称为分层时间存储器(HTM)的新皮层理论的开源项目。 HTM理论的一部分已经在应用中实现,测试和使用,并且HTM理论的其他部分仍在开发中。

Commits: 6088, Contributors: 76, Github URL: NuPIC

11、Neon是Nervana的基于Python的深度学习库。 它提供易用性,同时提供最高的性能。

Commits: 875, Contributors: 47, Github URL: Neon

12、Nilearn 一个Python模块,用于在NeuroImaging数据上快速轻松地进行统计学习。 它利用scikit-learn Python工具箱来处理多变量统计信息,包括预测建模,分类,解码或连接分析。

Commits: 5254, Contributors: 46, Github URL: Nilearn

13、Orange3是开源机器学习和数据可视化的新手和专家。 具有大型工具箱的交互式数据分析工作流程。

Commits: 6356, Contributors: 40, Github URL: Orange3

14、Pymc 一个实现贝叶斯统计模型和拟合算法的python模块,包括马尔可夫链蒙特卡罗。 其灵活性和可扩展性使其适用于大量问题。

Commits: 2701, Contributors: 37, Github URL: Pymc

15、PyBrain is 一个用于Python的模块化机器学习库。 它的目标是为机器学习任务提供灵活,易于使用但仍然强大的算法,以及各种预定义环境,以测试和比较您的算法。

Commits: 984, Contributors: 31, Github URL: PyBrain

16、Fuel 是一个数据管道框架,为您的机器学习模型提供他们需要的数据。 它计划被Blocks 和Pylearn2神经网络库使用。

Commits: 1053, Contributors: 29, Github URL: Fuel

17、PyMVPA 是一个Python包,旨在简化大型数据集的统计学习分析。 它提供了一个可扩展的框架,具有用于分类,回归,特征选择,数据导入和导出的广泛算法的高级接口。

Commits: 9258, Contributors: 26, Github URL: PyMVPA

18、Annoy (Approximate Nearest Neighbors Oh Yeah)是一个C ++库,使用Python绑定来搜索靠近给定查询点的空间中的点。 它还创建大型只读的基于文件的数据结构,这些数据结构被映射到内存中,以便许多进程可以共享相同的数据。

Commits: 365, Contributors: 24, Github URL: Annoy

19、Deap 一个用于快速原型和测试思想的新型进化计算框架。 它试图使算法显式和数据结构透明。 它与并行机制(例如多处理和SCOOP)完美协调。

Commits: 1854, Contributors: 21, Github URL: Deap

20、Pattern 是Python编程语言的Web挖掘模块。

它捆绑了数据挖掘工具(Google + Twitter +维基百科API,网络爬虫,HTML

DOM解析器),自然语言处理(词性标记,n元语法搜索,情感分析,WordNet),机器学习 ,k-means聚类,朴素贝叶斯+ k-NN +

SVM分类器)和网络分析(图形中心性和可视化)。

Commits: 943, Contributors: 20  , Github URL: Pattern

python 开源项目 书_十大 Python 机器学习开源项目相关推荐

  1. python机器学习开源代码_2016 年十大 Python 机器学习开源项目

    2016年十大Python机器学习开源项目 1.Scikit-learn 用于数据挖掘和数据分析的简单而有效的工具,基于NumPy,SciPy和matplotlib,开源,商业可用的BSD许可证. C ...

  2. python常用代码入门-入门十大Python机器学习算法(附代码)

    入门十大Python机器学习算法(附代码) 今天,给大家推荐最常用的10种机器学习算法,它们几乎可以用在所有的数据问题上: 1.线性回归 线性回归通常用于根据连续变量估计实际数值(房价.呼叫次数.总销 ...

  3. 文本分析软件_十大针对机器学习的文本注释工具与服务,你选哪个?

    房地产和键 [51CTO.com快译]目前,从搜索引擎与情感分析,到虚拟助手与聊天机器人,机器学习应用场景中的许多研究领域,都需要通过文本注释工具与服务来提供准确性.在AI研究与开发行业中,发现或创建 ...

  4. python调用库有哪些_十大Python机器学习常用库 python开发,你用过几个?

    1.Pipenv Pipenv 是 Kenneth Reitz 的业余项目,旨在将其他软件包(例如 npm 和 yarn)整合到 Python 里.它不需要安装 virtualenv, virtual ...

  5. python数据处理高斯滤波_十大点云数据处理技术梳理

    研究点云数据时,感觉无从下手? 看看这十大点云数据处理技术,换个思路学点云. 点云 · 定义 简言之,在获取物体表面每个采样点的空间坐标后,得到的是一个点的集合,称之为"点云".包 ...

  6. 济南python工资一般多少-济南十大python编程培训机构排行榜

    导语概要 信盈达12年专注互联网IT开发人员培养,主要课程有嵌入式培训,物联网培训,单片机培训,Linux课程, ARM课程,Java语言培训, C/C++语言培训,Python培训等,欢迎各位学子来 ...

  7. python timeit用法_十大Python开发技巧

    Python开发指南, 超级实用足以让您震撼 > Photo by Christina Morillo from StockSnap 时不时地,当我了解Python的新功能时,或者我发现其他一些 ...

  8. python排序算法实现_十大排序算法python实现

    进程和线程 进程和线程的主要差别在于它们是不同的操作系统资源管理方式.进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程只是一个进程中的不同执行路径.线程有自己的堆栈和局 ...

  9. python集合应用场景_十、python 集合的定义与使用

    一.集合的定义 定义:由不同元素组成的集合,集合是一组无序排列 可hash值,可作为字典的key. 特性:集合的目的是将不同的值存放在一起,不同的集合间用来做关系运算,无须纠结于集合中的单个值. (1 ...

最新文章

  1. AAAI | 深度生成模型—NEVAE
  2. [20180606]如何dump数据库里面的汉字.txt
  3. python中为什么需要使用“if __name__ == '__main__'”语句
  4. 程序员的精力呵护指南!来自十年程序员的精力管理经验
  5. 观察内核linux行为,观察linux行为 实验报告.doc
  6. django python3.6_Django+mysql+python3.6.5 Windows
  7. 安卓数字倒数控件_安卓11来了,感受一下
  8. 利用layui来完成垂直和侧边导航的小案例
  9. umts是移动还是联通_联通与电信合建5G:核心网各自建设 5G频率资源共享
  10. 孙鑫VC学习笔记:第十三讲 (四) 生成可串行化的类
  11. 大学四年,电脑必备的三个宝藏工具软件
  12. 万用表的使用方法 (图解)
  13. 如何用公众号关联认证小程序
  14. LaTex引用中文论文
  15. 网页上传图片时,直接本地预览无需上传服务器
  16. vue3相比vue2效率提升在哪些方面?
  17. Leetcode LCP 17. 速算机器人
  18. NAT(地址转换模式)
  19. 【PAT甲级】1146 Topological Order
  20. 三位符号位如何看正负计算机,如何判断三角函数值符号的正负

热门文章

  1. UCloud Ubuntu 18.04 配置GPU环境踩坑指南,包括驱动,CUDA,Docker,Nvidia-Docker等
  2. 有限个无穷小的和也是无穷小
  3. Android 13 功能和变更列表
  4. c 中的ajax异步刷新,jstl中c:foreach下的表格实现异步刷新
  5. matlab实现CP分解 代码
  6. 计算机本科学生毕业设计课题,计算机科学与技术本科毕业设计选题.doc
  7. 对象方法Dive into Python读书笔记3
  8. TCP|Android上TCP通信实现
  9. timewrap 算法
  10. 【Test】GacUI 1.0 眼看着就要写完了 (4)