二、Pandas 安装和支持软件

在我们开始对 Pandas 进行数据分析之前,我们需要确保已安装该软件并且环境处于正确的工作状态。 本节介绍了 Python(如有必要),pandas 库以及 Windows,MacOSX 和 Linux 平台的所有必需依赖项的安装。 我们讨论的主题包括:

选择 Python 版本

安装 Python

安装 Pandas(0.16.0)

安装 IPython 和 Virtualenv

以下部分概述的步骤在大多数情况下应该有效,但是您的里程可能会因设置而异。 在不同的操作系统版本上,脚本可能无法始终完美运行,并且系统中已经存在的第三方包有时可能与提供的说明冲突。

选择要使用的 Python 版本

在继续安装和下载 Python 和 Pandas 之前,我们需要考虑将要使用的 Python 版本。 当前,当前使用的 Python 有两种版本,分别是 Python 2.7.x 和 Python3。如果读者是 Python 和 Pandas 的新手,那么问题就变成了他/她应该采用哪种语言。

从表面上看,Python 3.x 似乎是更好的选择,因为 Python 2.7.x 被认为是传统,而 Python 3.x 被认为是该语言的未来。

注意

Python 2.x 和 3 之间的主要区别包括 Python3 中更好的 Unicode 支持,将print和exec更改为函数以及整数除法。 有关更多详细信息,请参见 Python 3.0 的新增功能。

但是,出于科学,数值或数据分析的目的,建议使用 Python 2.7 而不是 Python3,原因如下:Python 2.7 是大多数当前发行版的首选版本,并且对某些库的 Python 3.x 支持不那么强, 尽管这已不再是一个问题。

作为参考,请查看标题为科学家们将迁移到 Python3 吗?的文档。 因此,本书将使用 Python 2.7。 它并不排除使用 Python3,使用 Python3 的开发人员可以通过参考以下文档轻松地对示例进行必要的代码更改:将 Python2 代码移植到 Python3。

Python 安装

在这里,我们详细介绍了在多个平台上安装 Python 的情况 -- Linux,Windows 和 MacOSX。

Linux

如果您使用的是 Linux,则很可能预装了 Python。 如果不确定,请在命令提示符下键入以下内容:

which python

根据您的发行版和特定的安装情况,很可能在 Linux 的以下文件夹之一中找到 Python:

/usr/bin/python

/bin/python

/usr/local/bin/python

/opt/local/bin/python

您可以通过在命令提示符下键入以下命令来确定安装了哪个特定版本的 Python:

python --version

如果尚未安装 Python,这种情况极少发生,您需要确定所使用的 Linux 版本,然后下载并安装它。 这是安装命令以及各种 Linux Python 发行版的链接:

Debian/Ubuntu (14.04)

sudo apt-get install Python 2.7

sudo apt-get install Python 2.7-devel

Debian Python 页面位于这里。

Redhat Fedora/Centos/RHEL

sudo yum install python

sudo yum install python-devel

Fedora 软件安装在这个页面上。

OpenSuse

sudo zypper install python

sudo zypper install python-devel

有关安装软件的更多信息,请参见这里。

Slackware:对于此 Linux 发行版,最好下载压缩的 tarball 并从源代码中安装它,如以下部分所述。

从压缩 tarball 安装 Python

如果上述方法都不适合您,您还可以下载压缩的 tarball(XZ 或 Gzip)并安装。 以下是有关这些步骤的简要概述:

#Install dependencies

sudo apt-get install build-essential

sudo apt-get install libreadline-gplv2-dev libncursesw5-dev libssl-dev libsqlite3-dev tk-dev libgdbm-dev libc6-dev libbz2-dev

#Download the tarball

mkdir /tmp/downloads

cd /tmp/downloads

wget http://python.org/ftp/python/2.7.5/Python-2.7.5.tgz

tar xvfz Python-2.7.5.tgz

cd Python-2.7.5

# Configure, build and install

./configure --prefix=/opt/Python 2.7 --enable-shared

make

make test

sudo make install

echo "/opt/Python 2.7/lib" >> /etc/ld.so.conf.d/opt-Python 2.7.conf

ldconfig

cd ..

rm -rf /tmp/downloads

Windows

与 Linux 和 Mac 发行版不同,Python 未预先安装在 Windows 上。

核心 Python 安装

标准方法是使用来自 CPython 团队的 Windows 安装程序,它们是 MSI 包。 可从此处下载 MSI 包。

根据您的 Windows 版本是 32 位还是 64 位,选择适当的 Windows 包。 默认情况下,Python 被安装到包含版本号的文件夹中,因此在这种情况下,它将被安装到以下位置:C:\Python27。

这使您可以运行多个版本的 Python 而不会出现问题。 安装后,应将以下文件夹添加到PATH环境变量:C:\Python27\和C:\Python27\Tools\Scripts。

第三方 Python 软件安装

为了使其他包(例如 pandas)的安装更加容易,需要安装一些 Python 工具。 安装 Setuptools 和 PIP。 Setuptools 对于安装其他 Python 包(例如 pandas)非常有用。 它增加了标准 Python 发行版中distutils工具提供的打包和安装功能。

要安装 Setuptools,请从这个链接下载ez_setup.py脚本。

然后,将其保存到C:\Python27\Tools\Scripts。

然后,运行ez_setup.py:C:\Python27\Tools\Scripts\ez_setup.py。

关联的命令pip为开发人员提供了易于使用的命令,该命令可以快速轻松地安装 Python 模块。 从这个链接下载get-pip脚本。

然后,从以下位置运行它:C:\Python27\Tools\Scripts\get-pip.py。

Windows 上还有第三方 Python 提供商,这些任务使安装任务变得更加容易。 它们列出如下:

MacOSX

MacOSX 的当前和最新发行版(过去 5 年)中已预安装了 Python 2.7。可以在 Mac 上的以下文件夹中找到由 Apple 提供的预安装版本:

/System/Library/Frameworks/Python.framework

/usr/bin/python

但是,您可以从这个链接安装自己的版本。 一个需要注意的是,您现在将拥有两个 Python 安装,并且必须小心确保路径和环境完全分开。

使用包管理器进行安装

也可以使用 Mac 上的包管理器(例如 Macports 或 Homebrew)安装 Python。 我将在这里讨论使用 Homebrew 进行的安装,因为这似乎是最方便用户的操作。 作为参考,您可以浏览标题为在 MacOSX 上安装 Python的文档。 步骤如下:

安装 Homebrew 并运行:

ruby -e "$(curl -fsSL https://raw.github.com/mxcl/homebrew/go)"

然后,您需要在PATH环境变量的顶部添加 Homebrew 文件夹。

在 Unix 提示符下安装 Python 2.7:

brew install python

安装第三方软件:分发并点子。 安装 Homebrew 会自动安装这些包。 分发和 PIP 使一个人可以轻松下载和安装/卸载 Python 包。

从第三方供应商安装 Python 和 Pandas

安装 Python,Pandas 及其相关依赖项的最直接方法是使用第三方供应商(如 Enthought 或 Continuum Analytics)安装打包的发行版。

我以前更喜欢 Continuum Analytics Anaconda 而不是 Enthought,因为 Anaconda 是免费赠送的,而 Enthought 过去是为完全访问其所有数字模块收取订阅费用。 但是,在最新版的 Enthought Canopy 中,几乎没有办法将这两个发行版分开。 不过,我个人比较喜欢 Anaconda,因此将介绍其安装版本。

作为参考,请参见 Anaconda Python 发行版。 现在,我将简要介绍 Anaconda 包及其安装方法。

Continuum Analytics Anaconda

Anaconda 是免费的 Python 发行版,专注于大规模数据处理,分析和数值计算。 以下是 Anaconda 的主要功能:

它包括最受欢迎的 Python 包,用于科学,工程,数值和数据分析。

它是完全免费的,并且可在 Linux,Windows 和 MacOSX 平台上使用。

安装不需要 root 或本地 admin 特权,并且整个包都安装在一个文件夹中。

多个安装可以共存,并且该安装不会影响系统上预先存在的 Python 安装。

它包括诸如 Cython,NumPy,SciPy,pandas,IPython,matplotlib 之类的模块,以及自产的 Continuum 包,如 Numba,Blaze 和 Bokeh。

有关此的更多信息,请参考这个链接。

安装 Anaconda

以下说明详细说明了如何在所有三个平台上安装 Anaconda。 下载位置是这里。 Python 的版本默认为 Anaconda 中的 Python 2.7。

Linux

执行以下步骤进行安装:

从下载位置下载 Linux 安装程序(32/64 位)。

在终端中,运行以下命令:

bash

例如,bash Anaconda-1.8.0-Linux-x86_64.sh。

接受许可条款。

指定安装位置。 我倾向于在本地第三方软件安装中使用$HOME/local。

MacOSX

执行以下步骤进行安装:

从下载位置下载 Mac 安装程序(.pkg file - 64-bit)。

双击.pkg文件进行安装,然后按照弹出窗口中的说明进行操作。 例如,包文件名:Anaconda-1.8.0-MacOSX-x86_64.pkg。

Windows

在 Windows 环境中执行以下步骤:

从下载位置下载 Windows 安装程序(.exe file - 32/64-bit)。

双击.pkg文件进行安装,然后按照弹出窗口中的说明进行操作。 例如,包文件名:Anaconda-1.8.0-MacOSX-x86_64.pkg。

所有平台的最后一步

作为快捷方式,您可以将ANACONDA_HOME定义为安装 Anaconda 的文件夹。 例如,在我的 Linux 和 MacOSX 安装中,我具有以下环境变量设置:

ANACONDA_HOME=$HOME/local/anaconda

在 Windows 上,如下所示:

set ANACONDA_HOME=C:\Anaconda

将 Anaconda bin文件夹添加到PATH环境变量。 如果您希望默认使用 Python Anaconda,可以通过确保$ANACONDA_HOME/bin在包含 System Python 的文件夹之前的PATH变量的开头来实现。 如果您不想默认使用 Anaconda Python,则有以下两种选择:

每次根据需要激活 Anaconda 环境。 可以执行以下操作:

source $HOME/local/anaconda/bin/activate $ANACONDA_HOME

为 Anaconda 创建一个单独的环境。 这可以通过使用内置的conda命令来完成。

有关更多信息,请阅读 Conda 文档。 可以从 Anaconda 安装页面获得更详细的安装 Anaconda 的说明。

下载并安装 Pandas

pandas 库是 Python 语言的一部分,因此我们现在可以继续安装 pandas。 在撰写本书时,可用的 Pandas 的最新稳定版本是 0.12 版。 各种依赖项以及相关的下载位置如下:

是否必需

描述

下载位置

NumPy : 1.6.1 or higher

必需

用于数值运算的 NumPy 库

python-dateutil 1.5

必需

日期操作和工具库

Cython

可选,推荐

用于优化的 Python C 扩展

SciPy

可选,推荐

适用于 Python 的科学工具集

matplotlib

可选,推荐

类似于 Matlab 的 Python 绘图库

statsmodels

可选

Python 的统计模块

openpyxl

可选

读取/写入 Excel 文件的库

xlrd/xlwt

可选

读取/写入 Excel 文件的库

boto

可选

用于访问 Amazon S3 的库

BeautifulSoup和html5lib,lxml中的一个

可选

read_html()函数运行所需的库

lmxl

可选

用于处理 XML 和 HTML 的 Python 库

Linux

对于流行的 Linux 版本,安装 pandas 非常简单。 首先,请确保已安装 Python .dev文件。 如果不是,则按照下一节中的说明安装它们。

Ubuntu/Debian

对于 Ubantu/Debian 环境,运行以下命令:

sudo apt-get install python-dev

RedHat

对于 RedHat 环境,运行以下命令:

yum install python-dev

现在,我将向您展示如何安装 Pandas。

Ubuntu/Debian

要在 Ubuntu/Debian 环境中安装 Pandas,请运行以下命令:

sudo apt-get install python-pandas

Fedora

对于 Fedora,运行以下命令:

sudo yum install python-pandas

OpenSuse

通过 YaST 软件管理安装python-pandas或使用以下命令:

sudo zypper install python-pandas

有时,先前的安装可能需要附加的依赖关系,尤其是在 Fedora 的情况下。 在这种情况下,您可以尝试安装其他依赖项:

sudo yum install gcc-gfortran gcc44-gfortran libgfortran lapack blas python-devel

sudo python-pip install numpy

MacOSX

在 MacOSX 上有多种安装 Pandas 的方法。以下各节中将对它们进行说明。

源码安装

Pandas 有一些依赖项使其正常工作,一些是必需的,而另一些则是可选的,尽管某些理想的功能需要正常工作。 这将安装所有必需的依赖项:

安装easy_install程序:

wget http://python-distribute.org/distribute_setup.pysudo python distribute_setup.py

安装 Cython

sudo easy_install -U Cython

然后,您可以从源代码进行安装,如下所示:

git clone git://github.com/pydata/pandas.git

cd pandas

sudo python setup.py install

二进制安装

如果已按照 Python 安装部分中的说明安装了 PIP,则安装 pandas 的过程如下所示:

pip install pandas

Windows

以下方法描述了 Windows 环境中的安装。

二进制安装

确保首先安装numpy,python-dateutil和pytz。 每个模块都需要运行以下命令:

对于python-dateutil:

C:\Python27\Scripts\pip install python-dateutil

对于pytz:

C:\Python27\Scripts\pip install pytz

从二进制文件下载进行安装,然后从这里运行适用于 Windows 版本的二进制文件。 例如,如果您的处理器是 AMD64,则可以使用以下命令下载并安装 Pandas:

下载以下文件:(适用于 Pandas 0.16)

pandas-0.16.1-cp26-none-win_amd64.whl (md5)

通过pip安装下载的文件:

pip install

pandas-0.16.1-cp26-none-win_amd64.whl

要测试安装,请运行 Python 并在命令提示符下键入以下内容:

import pandas

如果返回没有错误,则说明安装成功。

源码安装

此处的步骤完全解释了安装:

确保将MingW二进制位置添加到附加了C:\MingW\bin的PATH变量中。

安装Cython和Numpy。

可以从这里下载并安装Numpy。

可以从这里下载和安装Cython

安装Cython的步骤如下:

通过 PIP 安装:

C:\Python27\Scripts\pip install Cython

直接下载:

您只需下载 zip 文件并将其解压缩到合适的文件夹中即可。

转到包含 Pandas 下载to C:\python27\python的文件夹,然后运行setup.py install。

有时,在运行setup.py时可能会出现以下错误:

distutils.errors.DistutilsError: Setup script exited with error:

Unable to find vcvarsall.bat

这可能与未正确指定mingw作为编译器有关。 检查您是否再次按照所有步骤进行操作。

从源头在 Windows 上安装 Pandas 容易出现许多错误和错误,因此不建议这样做。

IPython

交互式 Python(IPython)是一个非常有用的工具,可用于使用 Python 进行数据分析,并在此处提供安装步骤的简要说明。 IPython 提供了一个比标准 Python 提示有用得多的交互式环境。 其功能包括:

制表符补全可帮助用户进行数据浏览。

全面的帮助功能,使用object_name?打印有关对象的详细信息。

魔术函数使用户能够使用%run魔术命令在 IPython 中运行操作系统命令,并运行 Python 脚本并将其数据加载到 IPython 环境中。

通过_,__和__变量,%history和其他魔术功能以及上下箭头键的历史功能。

有关更多信息,请参见文档。

IPython 笔记本

IPython Notebook 是启用 Web 的 IPython 版本。 它使用户可以将代码,数值计算以及显示图形和富媒体组合在一个文档中,即笔记本。 笔记本可以与同事共享,并转换为 HTML/PDF 格式。 有关更多信息,请参考标题为 IPython 笔记本的文档。 这是一个例子:

PYMC Pandas 示例的先前图片来自这里。

IPython 安装

推荐的安装 IPython 的方法是使用第三方包,例如 Continuum 的 Anaconda 或 Enthought Canopy。

Linux

假设已按照说明安装了 Pandas 和其他用于科学计算的工具,则以下单行命令就足够了:

对于 Ubuntu/Debian,请使用

sudo apt-get install ipython-notebook

对于 Fedora,请使用

sudo yum install python-ipython-notebook

如果已安装pip和setuptools,也可以通过以下命令将其安装在 Linux/Mac 平台上:

sudo pip install ipython

Windows

IPython 在 Windows 上需要setuptools和PyReadline库。 PyReadline是 GNU readline库的 Python 实现。 要在 Windows 上安装 IPython,请执行以下步骤:

如上一节中所述安装setuptools。

通过从 PyPI Readline 包页面下载 MS Windows 安装程序来安装pyreadline。

从 GitHub IPython 下载位置下载并运行 IPython 安装程序。

MacOSX

可以使用pip或setuptools将 IPython 安装在 MacOSX 上。 它还需要readline和zeromq库,最好使用 Homebrew 进行安装。 步骤如下:

brew install readline

brew install zeromq

pip install ipython pyzmq tornado pygments

pyzmq,tornado和pygments模块是获得 IPython 笔记本的完整图形功能所必需的。 有关更多信息,请参见标题为为 OSX 设置 IPython 笔记本和 Pandas 的文档。

通过 Anaconda 安装(对于 Linux/MacOSX)

假设已经安装了 Anaconda,只需运行以下命令即可将 IPython 更新到最新版本:

conda update conda

conda update ipython

Continuum Analytics 的 Wakari

如果用户还没有准备好安装 IPython,则可以选择在云中使用 IPython。 输入 Wakari,这是一个基于云的分析解决方案,为 Continuum 服务器上托管的 IPython 笔记本电脑提供全面支持。 它允许用户在云上的浏览器中全部创建,编辑,保存和共享 IPython 笔记本。 可以在这个链接中找到更多详细信息。

Virtualenv

Virtualenv 是用于创建隔离的 Python 环境的工具。 如果您希望在不影响标准 Python 构建的环境中测试最新版本的 Pandas,这将很有用。

Virtualenv 的安装和使用

我只建议您在决定不安装和使用Anaconda包的情况下安装 Virtualenv,因为它已经提供了 Virtualenv 功能。 简要步骤如下:

通过pip安装:

pip install virtualenv

使用 Virtualenv

使用以下命令创建虚拟环境:

virtualenv newEnv

使用以下命令激活虚拟环境:

source newEnv/bin/activate

使用以下命令停用虚拟环境并返回到标准 Python 环境:

deactivate

有关此的更多信息,可以浏览标题为虚拟环境的文档。

提示

下载示例代码

其他以数字或分析为重点的 Python 发行版

以下是各种与第三方数据分析相关的 Python 发行版的摘要。 以下所有发行版均包含 Pandas:

Continuum Analytics Anaconda:免费的企业级 Python 发行版,专注于大规模数据处理,分析和数值计算。 有关详细信息,请参阅这里。

PythonXY:免费的面向科学和工程的 Python 发行版,用于数值计算,数据分析和可视化。 它基于 Qt GUI 包和 Spyder 交互式科学开发环境。 有关更多信息,请参阅这里。

WinPython:针对 Windows 平台的免费开源 Python 发行版,专注于科学计算。 有关更多信息,请参考这里。

有关 Python 发行版的更多信息,请访问这里。

总结

有两个主要的 Python 版本:Python 2.7.x 和 Python 3.x。 目前,Python 2.7.x 更成熟,因此更适合进行数据分析和数值计算。 为了正确设置,pandas 库需要一些依赖项– NumPy,SciPy 和 matplotlib 仅举几例。 有很多安装 Pandas 的方法–建议的方法是安装包括 Pandas 在内的第三方发行版之一。 发行版包括 Continuum 发行的 Anaconda,Enthough Canopy,WinPython 和 PythonXY。 强烈建议安装 IPython 包,因为它为数据分析提供了一个丰富,高度交互的环境。

因此,设置我们的学习 Pandas 的环境包括安装合适版本的 Python,安装 Pandas 及其相关模块,以及设置一些有用的工具,例如 IPython。 再强调一遍,我强烈建议读者通过安装 Anaconda 或 Enthought 等第三方发行版来帮自己一个忙,并使他们的工作更轻松,从而使他们的环境在尽可能短的时间内运行并无故障运行。 。 在下一章中,我们将直接研究 Pandas 的主要特征。

pythonxy安装包_apachecn-ds-zh相关推荐

  1. pythonxy安装包_python安装pip|pythonxy安装的时候选择了装到F盘,但是python27还是自动装在了C判,有没有办法都弄到F盘啊...

    怎么安装python3.7 python3.7的方法:1.进入python官网,下载相本的安装包:2.打开安装程序,开始进行安装:3.python的安装路径,等待安装完成:4.打开命令提示符,执行py ...

  2. pythonxy安装包_Python计算机视觉:安装

    为顺利帮助读者完成本书中实例的学习,译者已对代码做了相应整理,下面给出在对本书实例学习前,你需要做的前期安装工作.注意,下面译者给出的安装过程是针对Windows下的,其他平台如Linux.Mac请查 ...

  3. pythonxy安装包_Python软件包:Python(x,y)

    Python软件包:Python(x,y) 大家在用Python的时候,有没有一种感觉:确实用的很爽快,但是不断的要自己去安装各种安装包和库文件,是一件很麻烦的事情.今天发现一个牛逼软件包:Pytho ...

  4. linux/ubuntu中制作deb安装包

    linux/ubuntu中制作deb安装包 由于要制作一个在arm平台上运行的xorg-server-1.12.4版本的安装包,所以需要学习如何制作deb安装包.这里以一个非常小的工程为例,记录制作的 ...

  5. SolidWorks 2023软件安装教程SW2023软件安装包

    sw软件介绍: SOLIDWORKS 2023是领先的智能软件,使用强大的设计.分析和制备能力,旨在即时制造各种高端.复杂的产品,具有强大的能力和领先的技术,提供先进的建模技术和广泛的模块,以提高产品 ...

  6. VS2015安装(vs2015安装包+虚拟光驱DVDFab)

     此文粘贴自 https://blog.csdn.net/guxiaonuan/article/details/73775519?locationNum=2&fps=1 写的非常详细很适合 ...

  7. Xshell6和Xftp官网下载个人永久免费授权版方法和作者已下载好的安装包下载链接

    Xshell6和Xftp官网下载方法和安装包 作者本人也是在茫茫网海中浮沉了许久,终于找到了官网免费下载个人免费使用版本的下载办法,需要的朋友就跟随我操作下载吧,当然此处也会附上我已经下载好的安装包下 ...

  8. WebSphere V8.5 静默安装升级(一)-独立安装每个安装包

    声明:WAS8.5默认安装JDK 1.6.1,WAS8.5.5.9开始支持了JDK 1.8. [解压介质] WAS安装包: WAS_ND_V8.5.5_1_OF_3.zip WAS_ND_V8.5.5 ...

  9. 禅道Docker安装包发布

    禅道Docker安装包发布 大家好, 禅道Docker安装包发布. 一.下载地址 禅道开源版:   /dl/zentao/docker/docker_zentao.zip  备用下载地址:https: ...

最新文章

  1. Notepad++ 列编辑操作实例二则
  2. 如何使用matplotlib绘制一个函数的图像
  3. Cent OS dhcp配置
  4. 修改了xml要不要重新起服务器,关于设置:Eclipse每次运行项目时都会修改server.xml(运行-在服务器上运行)...
  5. FFmpeg架构之I/O模块分析
  6. 计算C(n,0)+C(n,1)+...+C(n,m)--Problem B. Harvest of Apples
  7. jQuery操作DOM节点的相关方法
  8. vsan网络分区不在同一组
  9. 《机器视觉算法与应用》第3章 机器视觉算法之光学字符识别(OCR)——学习笔记
  10. matebook14支持触摸屏吗_新款华为MateBook 14 2020款评测——触控屏来!
  11. MongoDB创建数据库
  12. 【MMDetection3D】基于单目(Monocular)的3D目标检测入门实战
  13. android locat
  14. 【转】我那实现了自己理想的创业老公,却一毛钱股份都没有拿到
  15. 软件测试工程师面试题之(计算机网络上)
  16. office 安装失败原因
  17. Python就业行情和前景分析之一
  18. PS-第三天-钢笔抠图及商业案例
  19. 唐桥医学云会议助力第二届世界中医药互联网产业大会
  20. 利用vscode调试vue代码

热门文章

  1. clover无缘无故隐藏书签栏原因
  2. 恒压板框过滤实验数据处理_黑河市板框滤布用途,高效过滤器-泰翔工业滤料
  3. 今日分享|闪魔钢化膜5.8/医用口罩60个18.8/手机壳5.6秒变iPhone12/苏打水一箱12瓶16.8/鼠标19.9/等...
  4. 古典密码(部分合集)
  5. 在 vue-cli 项目中添加标签页图标 favicon
  6. 架构详解——淘系圈品进化史
  7. C#控件CheckListBox的使用
  8. Python源码剖析:前言
  9. 【名度控股】建设门户网站的要点
  10. 分享117个HTML婚纱模板,总有一款适合您