[译]27个Jupyter Notebook小提示与技巧

图片链接已失效,欢迎前往我的博客查看最新版本

Jupyter Notebook

Jupyter notebook, 前身是IPython notebook, 它是一个非常灵活的工具,有助于帮助你构建很多可读的分析,你可以在里面同时保留代码,图片,评论,公式和绘制的图像。

screenshot
screenshot

Jupyter具有非常强的可扩展性,支持很多编程语言,并且易于部署到你的个人电脑和几乎所有的服务器上 -- 你只需要使用ssh或http接入即可。最重要的是,它完全免费。

Jupyter默认设置使用Python kernel,正因此以前叫做IPython notebook. Jupyter notebook源自于Jupyter项目, Jupyter这个名字是它被设计所支持三个核心编程语言的缩写词:JUlia,PYThon, 和 R, 启发自木星这个词:Jupiter.

接下来的内容将向你展示27个让Jupyter用的更加舒心的建议与技巧。

1. Keyboard Shortcuts

每一个进阶用户都知道,键盘快捷键将会为我们节省许多时间。Jupyter在顶部的菜单里保留了许多快捷键:Help > keyboard Shortcuts. 每次更新Jupyter时,都值得再次进行查看,因为新的快捷键总是不断被添加进来。

另一个查看快捷键的方式是使用命令面板:Cmd + Shift + P(或者Linux和Windows上 Ctrl + Shift + P)。这个对话框将会帮助你通过名称运行任何命令 -- 这非常有用,尤其当你不知道一个命令的快捷键或者你想要执行的命令没有快捷键时。这个功能非常类似与Mac上的Spotlight搜索,一旦你开始使用这个功能,你就会发现没有它的日子该怎么办!

命令面板
命令面板

这里是一些我喜欢的快捷键:

  • Esc + F查找和替换你的代码,但不包括代码的输出内容。

  • Esc + o打开代码块输出。

  • 选择多个cell。
    Shift + JShift + Down向下选中下一个cell. 你可以通过Shift + KShift + Up向上选中cell。

    • 一旦cell被选中,接着你可以进行批量删除/复制/剪切/粘贴.当你需要移动一部分notebook时,这非常有用。
    • 你也可以执行Shift + M对多个cell进行合并。
    interface
    interface

2. Pretty Display of Varibles

这部分内容可能很多人都知道。如果对带有一个变量或是未复制语句的cell执行操作,Jupyter将会打印该变量而无需一个输出语句。这非常有用,尤其是使用Pandas DataFrames进行处理时,因为输出将会被整齐地格式化为一个表格。

接下来的内容可能没那么人知道:你可以选择修改ast_note_iteractivelykernal选项来使得Jupyter为每一行的变量或语句执行这个操作,以便你可以立即看到多条语句一起输出。

多条语句同时输出
多条语句同时输出

如果你想要所有的Jupyter实例(Notebook和Console)都设置该选项,只需创建~/.ipython/profile_default/ipython_config.py文件并写入一下内容:

c = get_config()
# Run all nodes interactively
c.InteractiveShell.ast_node_interactivity = "all"

3. Easy links to documentation

Help菜单你可以找到一些常用库文档的连接,包括NumPy, Pandas, SciPy 和 Matplotlib.

同时别忘了在一个库,方法或变量前加上?,你可以获得一个快速的语法说明。

快捷语法查看
快捷语法查看

4. Plotting in notebooks

在notebook中生成绘图有许多选项:

  • matplotlib, 使用%matplotlib inline进行激活。
  • %matplotlib notebook提供了一些交互性,不过可能会有点慢,因为渲染由服务器端完成。
  • mpld3为matplotlib代码提供了另一个渲染器(使用d3)。非常漂亮,不过尚未完整。
  • bokeh是构建交互性绘图的一个更好的选择。
  • plot.ly也可以生成漂亮的绘图,不过是付费服务。
交互式图表
交互式图表

5. Jupyter Magic Commands

上面的%matplotlib inline就是一个所谓的Jupyter Magic(Jupyter魔法)命令。

magic命令
magic命令

推荐阅读the documentation for all Jupyter magic commands,你会发现这非常有用。下面是一些我所喜爱的魔法命令:

6. Jupyter Magic - %env:Set Environment Variables

你可以管理notebook的环境变量而无需重启jupyter server. 一些库(比如theano)使用环境变量来控制行为,%env是最方便的一个途径。

%env环境变量
%env环境变量

7. Jupyter Magic - %run:Excute python code

%run可以从.py文件执行Python代码. 更少的人知道的是它也可以执行其他的Jupyter notebook,这也非常有用。

%run运行python或jupyter notebook

注意使用%run并不等同于导入一个Python模块.

8. Jupyter Magic - %load:Insert the code from an external script

这将会使用外部脚本来代替cell的内容。你可以使用本地机器上的文件也可以使用一个URL.

%load加载外部脚本

9. Jupyter Magic - %store:Pass variables between notebooks

%store命令可以让你在两个不同的notebook间传递变量。

10. Jupyter Magic - %who:List all variables of global scope.

不带参数的%who命令将会列出全局范围内存在的所有变量。如果传入参数,比如str,将会列出指定类型的所有变量。

%who查看全局变量

11. Jupyter Magic - Timing

对于计时有两个十分有用的魔法命令:%%time%timeit. 如果你有些代码运行地十分缓慢,而你想确定是否问题出在这里,这两个命令将会非常方便。

  • %%time将会给出cell的代码运行一次所花费的时间。
%time
  • %timeit使用Python的timeit模块,它将会执行一个语句100,000次(默认情况下),然后给出运行最快3次的平均值。
%timeit

12. Jupyter Magic - %%writefile and %pycat:Export the contents of a cell/Show the contents of an external script

使用%%writefile魔法保存cell的内容到一个外部文件。%pycat则刚好相反,并且会向你展示高亮后的外部文件。

%writefile & %pycat

13. Jupyter Magic - %prun:Show how much time your program spent in each function

使用%prun statement_name将会产生一个有序表格来展示在该语句中所调用的每个内部函数调用的次数,每次调用的时间与该函数累计运行的时间。

%prun

14. Jupyter Magic - Debugging with %pdb

Jupyter有一个自己的python调试器接口(pdb),这使得我们能够进入函数内部看看到底发生了什么。

你可以在这里查看pdb的命令列表

15. Suppress the output of a final function

有时候你可能会想要抑制最后一行函数的输出,比如当我们绘制图像的时候。为此,你只需加上一个分号即可。

取消输出
取消输出

16. Executing Shell Commands

在notebook中执行shell命令非常容易,你可以像下面这样列出当前目录下的文件:

!ls
shell命令
shell命令

或是检查或管理包.

17. Using LaTeX for formulas

当你在markdown cell中书写LaTeX时,它会被MathJax渲染成一个公式。

$$ P(A \mid B) = \frac{P(B \mid A) \, P(A)}{P(B)} $$

会被渲染成为:

$$ P(A \mid B) = \frac{P(B \mid A) , P(A)}{P(B)} $$

markdown是notebook中十分重要的一部分,别忘了使用它来传达你的想法!

18. Run code from a different kernel in a notebooks

如果想要的话,你可以将多个kernel的代码组合到一个notebook中。

在每个cell的开头使用相关的魔法命令来声明你想使用的kernel:

  • %%bash
  • %%HTML
  • %%python2
  • %%python3
  • %%ruby
  • %%perl
运行多种类型的kernel
运行多种类型的kernel

19. Install other kernels for Jupyter

Jupyter其中的一个重要特色就是能够运行不同语言,你只需安装相关的kernel即可。比如,下面的例子是如何安装 R kernel.

  • 快捷选择:使用anaconda安装R kernel

如果你使用anaconda安装你的环境,这会相当简单。你只需要在terminal中运行下面的命令:

conda install -c r r-essentials
  • 不那么快捷的方式:手动安装R kernel

如果你不是使用anaconda, 这个过程可能稍显复杂。首先你需要从CRAN安装R, 如果你还没有安装的话。

安装R完毕后,打开R console并运行如下命令:

install.packages(c('repr', 'IRdisplay', 'crayon', 'pbdZMQ', 'devtools'))
devtools::install_github('IRkernel/IRkernel')
IRkernel::installspec()  # to register the kernel in the current R installation

20. Running R and Python in the same notebook

对于此最好的解决方案是安装rpy2(需要一个可以工作的R版本), 通过pip可以很容易安装:

pip install rpy2

你可以同时使用这两种语言,甚至在它们之间传递变量:

一个很好的示例Revolutions Blog

21. Writing functions in other languages

有时候numpy的速度仍旧不够快,我们需要自己写一些更快的代码。

原则上,你可以以动态链接库的方式编译函数,然后用python进行包装。

不过如果有人能够帮你完成这部分烦人的工作是不是非常棒呢?

你可以用cython或fortran写函数并直接从Python代码进行调用。

首先你需要安装:

!pip install cython fortran-magic

个人来说我更喜欢使用fortran, 我发现它对数值统计函数十分方便。更多用法上的细节可以在这里找到.

也有一些其他方式可以加速你的Python代码。更多示例可以在这里找到/

22. Multicursor support

Jupyter支持多光标操作,与Sublime Text类似。按住Alt进行点击和拖拽鼠标即可。

23. Jupyter-contrib extensions

Jupyter-contrib extensions 是一系列能够给Jupyter带来许多功能的扩展,比如jupyter spell-checkercode-formatter.

插件扩展
插件扩展

24. Create a presentation from a Jupyter notebook

Damian Avila的 RISE允许你从已有的一个notebook创建一个powerpoint风格的报告。

你可以通过conda安装RISE:

conda install -c damianavila82 rise

或通过pip:

pip install RISE

然后执行下面的代码安装并启用扩展:

jupyter-nbextension install rise --py --sys-prefix
jupyter-nbextension enable rise --py --sys-prefix

25. The Jupyter output system

notebook以HTML的方式进行展示,cell的输出也可以是HTML,所以事实上你可以返回任何东西:视频/音频/图像。

下面的例子我扫描了

26. 'Big data' analysis

对于大规模数据样本的查询/处理也有一些解决方案:

27. Sharing notebooks

分享notebook最简单的方式是直接使用notebook文件(.ipynb).不过对于那些不使用Jupyter的人来说,你也可以这么做:

  • 使用菜单项File > Download as > HTML将notebook转换成HTML。

  • 使用gist或github分享notebook,它们都会对notebook进行渲染展示。

    • 如果你上传notebook到一个github仓库,你可以使用十分便利的mybinder服务来允许第三者半小时的交互性身份接入你的仓库。

[译者]
useful links: https://github.com/dunovank/jupyter-themes
原文地址:27 Jupyter Notebook tips, tricks and shortcuts

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容