数据分析与机器学习介绍

数据分析与机器学习

课程概述

  • 数据分析
    • 数据采集
    • 数据清洗
    • 数据规约
    • 数据预处理
    • 可视化
    • 数据分析报告
    • 特征工程
  • 机器学习
    • 回归
    • 分类
    • 聚类
  • 深度学习
    • 神经网络(CNN)
  • 数学基础
    • 高等数学
    • 概率
    • 线性代数

今天的课程内容

  • jupyter的具体使用
  • markdown的使用
  • latex的使用
  • python代码

jupyter的使用

jupyter的安装
  • python环境的安装
    • 直接安装python(从官网下载)
    • anaconda(大蟒蛇,python数据分析全家桶)
    • pypy(python高效能解释器)
    • docker(虚拟化技术)
  • 安装jupyter
    pip install jupyter -i https://pypi.tuna.tsinghua.edu.cn/simple/
    
  • 如果安装过anaconda不用再执行pip安装
  • 按照如下方法校验安装结果
    #打开cmd,执行
    jupyter notebook
    
  • 可能出现的问题
    • jupyter命令找不到(解决:使用windows全局搜索,找到jupyter.exe,添加入环境变量)
    • 执行jupyter notebook 浏览器没有自动打开
      • 没有设置默认浏览器
      • 防火墙阻止打开浏览器(手工粘贴启动提示中带token的地址)
jupyter的使用
  • 什么是jupyter

    1. 一个能够在网页运行python代码的环境,能够帮我们保留中间运行结果,便于数据分析。
    2. CS模式,可以运行在服务器上
  • 基本使用

    • esc键进入命令状态(左边指示条蓝色)
    • 回车或者鼠标左键进入编辑状态(左边指示条绿色)
    • shift+enter 执行(渲染)当前单元格,并且进入下一个单元格
    • h(全屏快捷键帮助)
    • b(在当前单元格下,添加一个单元格)
    • dd(删除当前单元格)
    • x(剪切当前单元格)
    • v(粘贴当前单元格)
    • m(markdown状态)
    • y(python代码状态)
    • l(显示行号)
  • 注意事项

    • 不要在两个编辑器中同时打开jupyter文件
身高 体重 年龄
170 100 21
175 120 22

latext基本功能演示

函数f在x_0处的极限为L

\lim_{x \to x_0} f(x) = L

上标 X^n

X_{i > 10}

分数 \frac{5}{7}

对于 \forall \epsilon >0 \exists \delta > 0,使得任意满足|x - x_0| < \delta 的x都有|f(x) - L| < \epsilon

如果一个函数f(x)在x_0处有定义,存在极限 L = \lim_{x \to x_0} \frac{f(x) - f(x_0)}{x - x_0}

\int_{a}^{b} f(x) = F(b) - F(a)

A = \begin{bmatrix} x_{11} & x_{12} & x_{13} \\ x_{21} & x_{22} & x_{23} \end{bmatrix}

\theta = \begin{bmatrix} \theta_1 \\ \theta_2 \\ \theta_3 \end{bmatrix}

A \theta = b

代码的写法

import numpy as np

使用tab键,可以自动完成

np.abs(-10)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。