为什么使用Python进行数据分析
- Python拥有巨大而活跃的科学计算社区
- Python不断改良的库(主要是pandas)
- Python作为胶水语言,轻松集成C,C++以及Fortran代码
但对于高并发,多线程的应用程序,python并不是一种理想的语言
Python进行数据分析的重要库
- Numpy: python进行科学计算的基础包
- 快速高效的多维数组对象ndarray
- 可以直接对元素以及数组进行数学运算
- 读写基于数组的数据集
- 包含线性代数/傅里叶变换/随机数生成等方法
- 用于将C/C++/Fortran代码集成到Python的工具.低级语言可直接操作Numpy数组中的数据
- Pandas: 高效快捷底处理结构化数据的大量数据结构和函数
- 拥有Numpy高性能的数组计算功能
- 表格和关系型数据库的数据处理功能
- 索引/重塑/切片/切块/聚合等便捷操作
- Matplotlib: 用于绘制图表的Python库
- Ipython/Jupyter: 由Python科学计算标准工具集组成,为交互式探索式计算提供了强健高效的环境
- SciPy: 一组专门解决科学计算中各种标准问题的包的集合
Anaconda的安装
Why?
- 可以在一个安装步骤中得到100多个最重要的Python库和软件包,且所有库与软件包相互配合(几乎包含了所有数据分析的库)
- 分发版本免费
- 可以用于Windows\MacOS\Linux平台
Anaconda下载地址
Ipython/jupyter中的魔法命令及快捷键
快捷键:
命令模式 (按键 Esc 开启)
- Enter : 转入编辑模式
- Shift-Enter : 运行本单元,选中下个单元
- Ctrl-Enter : 运行本单元
- Alt-Enter : 运行本单元,在其下插入新单元
- Y : 单元转入代码状态
- M :单元转入markdown状态
- R : 单元转入raw状态
- 1 : 设定 1 级标题
- 2 : 设定 2 级标题
- 3 : 设定 3 级标题
- 4 : 设定 4 级标题
- 5 : 设定 5 级标题
- 6 : 设定 6 级标题
- Up : 选中上方单元
- K : 选中上方单元
- Down : 选中下方单元
- J : 选中下方单元
- Shift-K : 扩大选中上方单元
- Shift-J : 扩大选中下方单元
- A : 在上方插入新单元
- B : 在下方插入新单元
- X : 剪切选中的单元
- C : 复制选中的单元
- Shift-V : 粘贴到上方单元
- V : 粘贴到下方单元
- Z : 恢复删除的最后一个单元
- D,D : 删除选中的单元
- Shift-M : 合并选中的单元
- Ctrl-S : 文件存盘
- S : 文件存盘
- L : 转换行号
- O : 转换输出
- Shift-O : 转换输出滚动
- Esc : 关闭页面
- Q : 关闭页面
- H : 显示快捷键帮助
- I,I : 中断Notebook内核
- 0,0 : 重启Notebook内核
- Shift : 忽略
- Shift-Space : 向上滚动
- Space : 向下滚动
编辑模式 ( Enter 键启动)
- Tab : 代码补全或缩进
- Shift-Tab : 提示
- Ctrl-] : 缩进
- Ctrl-[ : 解除缩进
- Ctrl-A : 全选
- Ctrl-Z : 复原
- Ctrl-Shift-Z : 再做
- Ctrl-Y : 再做
- Ctrl-Home : 跳到单元开头
- Ctrl-Up : 跳到单元开头
- Ctrl-End : 跳到单元末尾
- Ctrl-Down : 跳到单元末尾
- Ctrl-Left : 跳到左边一个字首
- Ctrl-Right : 跳到右边一个字首
- Ctrl-Backspace : 删除前面一个字
- Ctrl-Delete : 删除后面一个字
- Esc : 进入命令模式
- Ctrl-M : 进入命令模式
- Shift-Enter : 运行本单元,选中下一单元
- Ctrl-Enter : 运行本单元
- Alt-Enter : 运行本单元,在下面插入一单元
- Ctrl-Shift-- : 分割单元
- Ctrl-Shift-Subtract : 分割单元
- Ctrl-S : 文件存盘
- Shift : 忽略
- Up : 光标上移或转入上一单元
- Down :光标下移或转入下一单元