Python数据分析基础模块：Anaconda的安装以及简单使用

1、Anaconda下载路径

官网下载：https://www.anaconda.com/（网速好的可以从这里下载）

清华大学开源软件镜像站：（网速不好的可以从这里下载）
https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/

2、Anaconda Prompt打开方式（win8 64位系统环境下）

image.png

3、Anaconda 查看所有环境目录命令：conda env list

image.png

4、Anaconda 进入某一个环境目录命令：activate root(注意：root是环境名称，mac系统的是：source activate root)

image.png

5、Anaconda 查看某个环境下所安装的包：conda list

image.png

6、Anaconda 退出某个环境：deactivate

image.png

7、Anaconda 创建用户自己环境：conda create -n 名字（例如：conda create -n zlcpy3）

image.png

8、配置pycharm的工作环境

image.png

9、配置pycharm的文件模板

image.png

如何出现保存不了的情况，就把下面框中的文件删除掉

image.png

模板效果如下：

image.png

模板定义的参考文章：
https://www.cnblogs.com/jhao/p/6944383.html?utm_source=itdadao&utm_medium=referral

10、Anaconda 的基本使用

首先在命令行窗口进入自己创建的环境，然后按照numpy库

image.png

同样的安装方法，安装scipy、pandas等库

image.png

# -*- coding: utf-8 -*-
import numpy as np
from scipy import linalg
import pandas as pd
"""
-------------------------------------------------
   File Name：     test
   Description :
   Author :       Lenovo
   date：          2018/1/4
-------------------------------------------------
   Change Activity:
                   2018/1/4:
-------------------------------------------------
"""
__author__ = 'Lenovo'

# numpy的简单应用
# 以前的写法
for i in range(10):
    print(i)
# 0
# 1
# 2
# 3
# 4
# 5
# 6
# 7
# 8
# 9

# 现在的写法
print(np.arange(10))
# [0 1 2 3 4 5 6 7 8 9]

# 以前的写法
a = [1,2,3,4,5]
b = []
for i in a:
    b.append(i**2)
print(b)
# [1, 4, 9, 16, 25]

# 现在的写法
a = np.arange(1,6)
print(a)
# [1 2 3 4 5]

print(a**2)
# [1, 4, 9, 16, 25]

# 行列式
a = np.array([[1,2],[3,4]])
print(a)
# [[1 2]
#  [3 4]]


print(linalg.det(a))
# -2.0

# pandas的基本应用
s = pd.Series([2,3,5,np.nan,8,9])
print(s)
# 0    2.0
# 1    3.0
# 2    5.0
# 3    NaN
# 4    8.0
# 5    9.0

dates = pd.date_range("20171201",periods=7)
print(dates)
# dtype: float64
# DatetimeIndex(['2017-12-01', '2017-12-02', '2017-12-03', '2017-12-04',
#                '2017-12-05', '2017-12-06', '2017-12-07'],
#               dtype='datetime64[ns]', freq='D')

df = pd.DataFrame(np.random.randn(7,4),index=dates,columns=list('ABCD'))
print(df)
#                    A         B         C         D
# 2017-12-01 -0.267794 -1.970909 -0.285059  0.583872
# 2017-12-02  0.509023  1.812721 -1.473795  1.039633
# 2017-12-03  0.162599 -0.294537  1.992656 -1.466471
# 2017-12-04 -1.220114 -0.798851  1.873921  1.024887
# 2017-12-05 -0.283632 -0.431764 -0.751009 -1.797970
# 2017-12-06 -0.894589 -0.158992  1.553444 -0.851872
# 2017-12-07  0.375514  2.119276 -1.144065 -0.228605

print(df.T)
#    2017-12-01  2017-12-02  2017-12-03  2017-12-04  2017-12-05  2017-12-06  2017-12-07
# A   -0.267794    0.509023    0.162599   -1.220114   -0.283632   -0.894589   0.375514
# B   -1.970909    1.812721   -0.294537   -0.798851   -0.431764   -0.158992   2.119276
# C   -0.285059   -1.473795    1.992656    1.873921   -0.751009    1.553444   -1.144065
# D    0.583872    1.039633   -1.466471    1.024887   -1.797970   -0.851872   -0.228605

print(df.sort_values(by='B'))
#                    A         B         C         D
# 2017-12-01 -0.267794 -1.970909 -0.285059  0.583872
# 2017-12-04 -1.220114 -0.798851  1.873921  1.024887
# 2017-12-05 -0.283632 -0.431764 -0.751009 -1.797970
# 2017-12-03  0.162599 -0.294537  1.992656 -1.466471
# 2017-12-06 -0.894589 -0.158992  1.553444 -0.851872
# 2017-12-02  0.509023  1.812721 -1.473795  1.039633
# 2017-12-07  0.375514  2.119276 -1.144065 -0.228605

11、numpy、scipy 、Pandas 的基本作用

numpy提供常用的数值数组、矩阵等函数
numpy的优点：1、基于向量化的运算 2、进行数值运算时numpy数组比list效率高

scipy 是一种基于numpy的扩展用来做高等数学、信号处理、优化、统计的扩展包比如：线性代数统计的空间的数据结构

Pandas 是一种构建于Numpy的高级数据结构和精巧工具，快速简单的处理数据数据结构：Series和DataFrame

12、常用的高级数据分析库 nltk igraph scikit-learn

nltk 是做文本分析的文本处理

natural language toolkit 自然语言处理工具包

igraph 社交网络分析

scikit-learn 机器学习模型的训练算法的使用

Python数据分析基础模块：Anaconda的安装以及简单使用

1、Anaconda下载路径

2、Anaconda Prompt打开方式（win8 64位系统环境下）

3、Anaconda 查看所有环境目录命令：conda env list

4、Anaconda 进入某一个环境目录命令：activate root(注意：root是环境名称，mac系统的是：source activate root)

5、Anaconda 查看某个环境下所安装的包：conda list

6、Anaconda 退出某个环境：deactivate

7、Anaconda 创建用户自己环境：conda create -n 名字（例如：conda create -n zlcpy3）

8、配置pycharm的工作环境

9、配置pycharm的文件模板

10、Anaconda 的基本使用

11、numpy、scipy 、Pandas 的基本作用

12、常用的高级数据分析库 nltk igraph scikit-learn

推荐阅读更多精彩内容