Mac上快速搭建Python数据科学工作流:从零到Jupyter Notebook实战
如果你刚拿到一台Mac,准备投身数据科学或机器学习的世界,第一道门槛往往不是复杂的算法,而是如何优雅地配置一个顺手的开发环境。Mac系统自带的Python 2.7早已是“古董级”的存在,而如今Python 3才是数据科学领域的通用语言。直接上手安装Jupyter Notebook,却可能遇到版本冲突、依赖缺失、端口占用等一系列看似琐碎却足以劝退新手的麻烦。这篇文章,我将以一个过来人的身份,带你绕开那些常见的坑,用最清晰、最直接的方式,在Mac上构建一个以Python 3和Jupyter Notebook为核心的现代化数据科学工作流。整个过程,我们不仅追求“能用”,更追求“好用”和“理解为什么这么用”。
1. 理解Mac的Python环境:告别混乱,拥抱秩序
很多Mac新手遇到的第一个困惑是:为什么我的电脑里好像有好几个Python?输入python和python3命令,结果可能完全不同。这背后是Mac系统历史遗留问题与开发者现代需求之间的冲突。
macOS系统依赖:macOS的许多底层工具和脚本(比如一些网络配置工具)仍然依赖于系统自带的Python 2.7。苹果将其安装在/usr/bin/python路径下。强烈建议不要动它,也不要试图用新版本覆盖它。随意修改或删除系统Python,可能导致某些系统功能异常。
我们的目标:是在完全不干扰系统环境的前提下,为我们的数据科学工作安装一个全新的、纯净的、可自由管理的Python 3环境。这样既能使用最新的语言特性和库,又能保证系统的稳定性。
一个快速检查当前环境状态的方法是,在终端(Terminal)中分别运行以下命令:
which python
python --version
which python3
python3 --version
which命令会告诉你当前执行的命令来自哪个路径。通常,python会指向/usr/bin/python(系统Python 2),而python3可能不存在,或者指向一个你之前安装过的版本。我们的任务,就是为python3这个命令安装一个我们可控的、强大的“引擎”。
注意:在后续所有操作中,当我们提到安装Python包或运行Python脚本时,如果希望使用我们即将安装的新环境,请务必明确使用
python3和pip3命令,以区别于系统自带的python和pip。
2. 基石工具:使用Homebrew进行高效环境管理
在macOS上,手动编译安装和管理软件及其依赖是一项繁琐且容易出错的工作。Homebrew的出现,彻底改变了这一局面。它被称为“macOS缺失的包管理器”,其设计哲学是“将软件安装到它们自己的目录中,并将其文件符号链接到/usr/local”。简单说,Homebrew能以一种干净、统一的方式为你安装、更新和卸载成千上万的软件包。
2.1 安装Homebrew
Homebrew的安装命令简洁明了。打开你的终端(可以在“应用程序”->“实用工具”中找到“终端”),复制粘贴以下命令:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
这个脚本会自动检查系统需求(如Xcode命令行工具),并在你的用户目录下创建必要的文件结构。安装过程中,脚本会提示你输入密码(输入时屏幕无显示,输完按回车即可),并最终给出将Homebrew添加到环境变量(PATH)的指令,请务必按照屏幕提示执行那两行echo和eval命令。

121

被折叠的 条评论
为什么被折叠?



