Jupyter+Docker玩转《Python数据分析基础》

近年来,数据分析师成为了一个高薪而又热门的职业,如果你想跨入这一行又没什么编程基础,那么学习Python绝对是一个好的选择。因为Python的代码风格使代码更易于阅读和理解,和其他语言相比,其学习曲线没有那么陡峭。Python的一系列丰富的内建库和附加库可以方便地完成许多一般的数据处理和分析操作,让你可以轻松地一站式完成数据处理与分析任务,从而大大减轻编程的工作量。

图1 封面

开发环境搭建

如果你还是一个不会编程的小白,那么从安装python到下载各种包再到运行起程序的整个过程都够让你喝一壶的了。《Python数据分析基础》书中推荐了Anaconda Python,不过笔者认为安装Anaconda Python依然略显繁琐,下面是笔者总结的只需要三步就能玩转《Python数据分析基础》的具体步骤:

1、安装Docker

Docker是什么?可参考拙作《离不开的工具之Docker开发指南》,简单讲是一个用于环境封装的工具(集装箱)。如果没精力去了解也没关系,你只需要知道Docker用起来很方便就行了。Windows用户 从https://www.docker.com/docker-windows下载,Mac用户从https://www.docker.com/docker-mac下载,只需轻点Download Now from Docker Store按钮,按部就班的等待安装完成即可。

2、下载jupyter/scipy-notebook的Docker镜像

Jupyter是什么?Jupyter是一个交互式笔记本(大名鼎鼎的 IPython notebook 是它的原名,大部分入门型的Python书里都会提到它,本书也不例外)。用Jupyter写代码可以自动补全,比记事本高到不知哪里去了,每一段代码(cell)的运行结果能可以根据你的需要(代码)以文字、表、图等方式展现出来,而且会像真正的笔记本一样把结果保留在页面上,以便纵向对比。

然而Jupyter现在已经不只是Python的编辑器这么简单了,实际上它支持40多种编程语言,比如R、Ruby、Javascript、C#、Go、Scala、Erlang、以及新兴的Julia等…… ,根据任务和编程语言的不同,jupyter提供多种了预先打包好的官方镜像(https://hub.docker.com/r/jupyter/),和数据分析和科学计算有关的主要有两个镜像:1、scipy-notebook(https://hub.docker.com/r/jupyter/scipy-notebook/),是纯Python3.x环境;2、datascience-notebook(https://hub.docker.com/r/jupyter/datascience-notebook/)预装了Python、R、Julia,适合更高级的混合式开发。对于本书而言,完成所有的教程只需要安装scipy-notebook镜像,该镜像已经预装了本书所有用到的数据分析库。

介绍了这么多,到底怎么下载呢?其实很简单,只需要敲入一行命令即可 ——

docker pull jupyter/scipy-notebook

3、运行jupyter/scipy-notebook

用docker下载完 scipy-notebook 镜像后,我们敲入以下指令 ——

docker run -it --rm -p 8888:8888 jupyter/scipy-notebook

稍等一下,就会给出提示:

Copy/paste this URL into your browser when you connect for the first time, to login with a token:

http://localhost:8888/?token=84222a835fff50f7sssss9c8bb4a45a2e13dd387a86zzz

我们这时候只需要把最后那一行地址拷贝到浏览器,就可以见到一个搭建好的交互式Python数据分析开发环境了!是不是很简单?


数据分析起步

1、第一行程序

如图2所示,在Jupyter右侧菜单的New下选择Python3

图2 起步

会自动进入Python的命令行交互环境,我们试着敲入第一行代码,然后点击工具条上的 '⏯ Run'按钮,马上就可以看到执行结果。

图3 第一行代码

2、读文件

数据分析的数据来源有很大头是各种类型的文件,从文件中读取数据是基本功,我们先尝试自己读一个自己编写的文件:

(1)在Jupyter主入口的Files选项卡上选择 New -> Text File ,输入几行文字,再选择 File -> Save,会在主目录下看到一个 'untitled.txt' 文件,这就是你刚编辑过的文件,选择该文件,再在工具栏选择 Rename,可以修改其名称,我们把这个文件改名为 'abc.txt'

图4 新建文件

(2)在程序交互区域,输入如下代码 ——

input_file = 'abc.txt'

print("Output #144:")

with open(input_file, 'r', newline='') as filereader:

    for row in filereader:

        print("{}".format(row.strip()))

(3)点击 'Run'按钮,就可以得到如图5结果:

图5 读文件

3、上传并处理csv文件

(1)我们按第二章开头提供的地址,获取一个名为supplier_data.csv的文件

(2)在Jupyter主入口的Files选项卡上选择 Upload,会弹出文件选择对话框,选好要上传的文件,再点击upload,即可将指定文件传到Jupyter“服务器”上。

图7 上传文件

(3)在程序交互区,输入如下代码

import sys import pandas as pd

input_file = 'supplier_data.csv'

output_file = 'abc.csv'

data_frame = pd.read_csv(input_file)

print(data_frame)

data_frame.to_csv(output_file, index=False)

(4)点击 'Run'按钮,就可以看到格式化好的数据。并且在Jupyter的文件区我们还可以看到一个新生成的文件'abc.csv'

图8 读取csv文件

4、用matplotlib绘制图表📈

数据的可视化是我们做数据分析的重要组成部分,用Jupyter + matplotlib也可以轻松的完成这一工作。 我们在交互区输入第6章6.1.3中的代码,点击 'Run'按钮,一幅漂亮的折线图就产生了。

图9 matplotlib

总结:《Python数据分析基础》确实书如其名,非常的基础,可以把一个程序小白,手把手的带入数据分析的世界。

而我们利用Jupyter+Docker可以更加省去很多繁琐的安装/配置环节,更快的实现Python数据分析入门。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,794评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,050评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,587评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,861评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,901评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,898评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,832评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,617评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,077评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,349评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,483评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,199评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,824评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,442评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,632评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,474评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,393评论 2 352

推荐阅读更多精彩内容