起航了—— 数据分析班开班典礼
一、数据分析课程介绍
1、授课讲师:Mark
2、课程相关信息
上课时间
答疑时间:周一至周六下午13:30 - 晚上22:30
班主任:
录播百度盘地址
ev播放器秘钥
其它Mark:
技术
技术
技术问问题方式:
你的困惑+报错信息课程资料获取:
课后资料会下课后第一时间上传:笔记+视频+源码
资料分为:百度网盘 / 腾讯课堂如有疑问,大声呼唤班主任哟
3、学习内容
4、学习方法
- 重视基础
- 归纳总结,构建自己知识体系: 推荐使用xmind思维导图
- 三多法则:多练习、多应用、多思考
5、发展方向
6、课程注意事项
- 在课程每小段知识点讲解完毕之后: 会跟大家进行互动,那么希望大家积极的反馈该知识点的学习情况。
- 如有大部分同学反馈有疑问,则会停下来重新解释。但是同一个问题课题上重复讲解不超过2次。
- 关于课程我们会根据课堂内容适当拖堂,但考虑大家次日上班以及学习的效率问题,一般不会超过22:30。
- 关于直播 VS 录播
希望大家享受学习的过程,直播可以帮助大家更高效的学习。
录播建议:若没上直播课程,课后一定要抽时间补上录播,避免后期跟不上。录播学习不建议重复,如有需要建议先看课程笔记,带着疑问跟回放。 - 课堂纪律:不允许迟到早退,有请假的要提前和班主任老师或者我进行说明/ 对于要退出课堂的同学要在公屏说明原因。
- 关于节假日:国家法定节假日都正常休息,大家可以自由安排行程(如有特殊安排,会及时群公告说明)
二、数据分析介绍
1、数据分析基本概念
用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和概括总结的过程
2、数据分析的流程
3、为什么要学习数据分析
- 岗位有需求
- 机器学习的基础
- 数据科学的基础
4、数据分析工具
5、数据分析与数据挖掘的相似之处:
数据挖掘和数据分析都是对数据进行分析、处理等操作,从而得到有价值的知识
6、数据分析与数据挖掘的区别:
在应用工具上,数据分析更多的是借助现有的分析工具进行;而数据挖掘一般需要通过编程来实现。
在行业知识方面,数据分析要求对所从事的行业有比较深的了解,更多的是将数据与业务紧密结合起来;而数据挖掘不需要有太多的行业知识,更专注与技术层面。
7、环境部署
- Pycharm
- jupyter
三、Anaconda的使用
1、环境搭建
- 需要版本:python 3.6
-
检查python版本命令:where python
image.png
2、推荐使用清华大学开源软件镜像站(https://mirror.tuna.tsinghua.edu.cn/)
3、Anaconda 安装包可以到 (https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/) 下载
4、选择[Anaconda3-5.2.0-Windows-x86_64.exe]
5、Anaconda安装
6、检查安装是否成功
在开始菜单中多了一个Anaconda3(64-bit)文件夹说明安装成功
7、Anaconda运行介绍
-
运行Anaconda Prompt(命令终端)
image.png -
提示这是本地环境(base),可以输入命令conda list查看Anaconda自带的工具
image.png
四、jupyter的使用
1、jupyter的介绍
- Jupyter Notebook 是什么?
Jupyter Notebooks 是一款开源的网络应用,我们可以将其用于创建和共享代码与文档。其提供了一个环境,你无需离开这个环境,就可以在其中编写你的代码、运行代码、查看输出、可视化数据并查看结果。因此,这是一款可执行端到端的数据科学工作流程的便捷工具,其中包括数据清理、统计建模、构建和训练机器学习模型、可视化数据等等。
2、jupyter的特点
- 基于web的在线编辑器
- 可交互式
- .ipynb文件分享
- 支持markdown
3、jupyter的安装
- 首先需要在机器上安装有 Python。(建议python3.6-3.7都可)
-
安装命令(我这是在cmder中输入命令):pip install jupyter
image.png
4、打开jupyter(没有安康达的情况下)
- 首先需要建立单独项目文件夹(建议名称不要包含中文)
- windows+R输入cmd进入windows终端,切换到该文件夹路径下
我这是在文件管理的这个文件夹的地址处直接运行cmder,不用切换路径(英文和动手能力差请别笑哦)
image.png -
在cmder中键入命令:jupyter notebook
image.png
以上数据库界面不能关闭,否则弹出的页面无法使用
-
自动弹出的页面
image.png - 更换浏览器打开上面的页面
自动弹出的页面是默认浏览器打开的,如果想用其它的浏览器打开也是可以的。首先复制-http://localhost:8888
image.png
image.png
5、基础使用 Jupyter Notebook
-
打开笔记本后,你会看到顶部有三个选项卡:Files、Running 和 Clusters。其中,Files 基本上就是列出所有文件,Running 是展示你当前打开的终端和笔记本,Clusters 是由 IPython 并行提供的。
image.png -
点击页面右侧的「New」选项。
image.png
Python3 --> 创建python file
Text File --> 文本编辑器
Folder --> 创建文件夹
Teminal --> 终端(类似于Windows上的cmd)
-
创建python file
点击:New-->Python 3得到下图
image.png
在代码上面的菜单中,你有一些操作各个单元的选项:添加、编辑、剪切、向上和向下移动单元、运行单元内的代码、停止代码、保存工作以及重启 kernel。
Code --> 代码
Markdown --> 标记(在运行一段代码后添加你的结论、添加注释等。)
Raw NBConvert --> 原生NBConvert(将你的笔记本转换成另一种格式(比如 HTML)的命令行工具。)
Heading --> 标题(也是Markdown语法) -
重命名笔记名称
image.png -
项目文件中多个两样内容,一个文件夹和一个"瑶琪笔记.ipynb"
image.png 快捷键使用
运行 --> Ctrl+Enter
Esc --> 命令模式
Enter --> 编辑模式进入命令模式之后快捷键:
A--> 在活跃单元之上插入一个新单元
B--> 在活跃单元之下插入一个新单元
连续按两次 D--> 可以删除一个单元
Z--> 撤销被删除的单元
Y 会将当前活跃的单元变成一个代码单元
按住 Shift +上或下箭头可选择多个单元。在多选模式时,按住 Shift + M 可合并你的选择。处于编辑模式时快捷键:
Ctrl + Home 到达单元起始位置
Ctrl + S 保存进度
Ctrl + Enter 会运行整个单元块
Alt + Enter 不止会运行你的单元块,还会在下面添加一个新单元-
实际上不需要去背这些快捷键。可以进入命令模式,摁住H就可以看到快捷键了。
image.png