Python数据分析基础模块:Anaconda的安装以及简单使用

1、Anaconda下载路径

官网下载:https://www.anaconda.com/(网速好的可以从这里下载)

清华大学开源软件镜像站 :(网速不好的可以从这里下载)
https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/

2、Anaconda Prompt打开方式(win8 64位系统环境下)
image.png
image.png
3、Anaconda 查看所有环境目录命令:conda env list
image.png
image.png
4、Anaconda 进入某一个环境目录命令:activate root(注意:root是环境名称,mac系统的是:source activate root)
image.png
5、Anaconda 查看某个环境下所安装的包:conda list
image.png
6、Anaconda 退出某个环境:deactivate
image.png
7、Anaconda 创建用户自己环境:conda create -n 名字(例如:conda create -n zlcpy3)
image.png
image.png
image.png
image.png

image.png
image.png
8、配置pycharm的工作环境
image.png
image.png

image.png
image.png

image.png
9、配置pycharm的文件模板
image.png
image.png

如何出现保存不了的情况,就把下面框中的文件删除掉


image.png

模板效果如下:


image.png

模板定义的参考文章:
https://www.cnblogs.com/jhao/p/6944383.html?utm_source=itdadao&utm_medium=referral

10、Anaconda 的基本使用

首先在命令行窗口进入自己创建的环境,然后按照numpy库


image.png

同样的安装方法,安装scipy、pandas等库


image.png
# -*- coding: utf-8 -*-
import numpy as np
from scipy import linalg
import pandas as pd
"""
-------------------------------------------------
   File Name:     test
   Description :
   Author :       Lenovo
   date:          2018/1/4
-------------------------------------------------
   Change Activity:
                   2018/1/4:
-------------------------------------------------
"""
__author__ = 'Lenovo'

# numpy的简单应用
# 以前的写法
for i in range(10):
    print(i)
# 0
# 1
# 2
# 3
# 4
# 5
# 6
# 7
# 8
# 9

# 现在的写法
print(np.arange(10))
# [0 1 2 3 4 5 6 7 8 9]

# 以前的写法
a = [1,2,3,4,5]
b = []
for i in a:
    b.append(i**2)
print(b)
# [1, 4, 9, 16, 25]

# 现在的写法
a = np.arange(1,6)
print(a)
# [1 2 3 4 5]

print(a**2)
# [1, 4, 9, 16, 25]

# 行列式
a = np.array([[1,2],[3,4]])
print(a)
# [[1 2]
#  [3 4]]


print(linalg.det(a))
# -2.0

# pandas的基本应用
s = pd.Series([2,3,5,np.nan,8,9])
print(s)
# 0    2.0
# 1    3.0
# 2    5.0
# 3    NaN
# 4    8.0
# 5    9.0

dates = pd.date_range("20171201",periods=7)
print(dates)
# dtype: float64
# DatetimeIndex(['2017-12-01', '2017-12-02', '2017-12-03', '2017-12-04',
#                '2017-12-05', '2017-12-06', '2017-12-07'],
#               dtype='datetime64[ns]', freq='D')

df = pd.DataFrame(np.random.randn(7,4),index=dates,columns=list('ABCD'))
print(df)
#                    A         B         C         D
# 2017-12-01 -0.267794 -1.970909 -0.285059  0.583872
# 2017-12-02  0.509023  1.812721 -1.473795  1.039633
# 2017-12-03  0.162599 -0.294537  1.992656 -1.466471
# 2017-12-04 -1.220114 -0.798851  1.873921  1.024887
# 2017-12-05 -0.283632 -0.431764 -0.751009 -1.797970
# 2017-12-06 -0.894589 -0.158992  1.553444 -0.851872
# 2017-12-07  0.375514  2.119276 -1.144065 -0.228605

print(df.T)
#    2017-12-01  2017-12-02  2017-12-03  2017-12-04  2017-12-05  2017-12-06  2017-12-07
# A   -0.267794    0.509023    0.162599   -1.220114   -0.283632   -0.894589   0.375514
# B   -1.970909    1.812721   -0.294537   -0.798851   -0.431764   -0.158992   2.119276
# C   -0.285059   -1.473795    1.992656    1.873921   -0.751009    1.553444   -1.144065
# D    0.583872    1.039633   -1.466471    1.024887   -1.797970   -0.851872   -0.228605

print(df.sort_values(by='B'))
#                    A         B         C         D
# 2017-12-01 -0.267794 -1.970909 -0.285059  0.583872
# 2017-12-04 -1.220114 -0.798851  1.873921  1.024887
# 2017-12-05 -0.283632 -0.431764 -0.751009 -1.797970
# 2017-12-03  0.162599 -0.294537  1.992656 -1.466471
# 2017-12-06 -0.894589 -0.158992  1.553444 -0.851872
# 2017-12-02  0.509023  1.812721 -1.473795  1.039633
# 2017-12-07  0.375514  2.119276 -1.144065 -0.228605
11、numpy、scipy 、Pandas 的基本作用

numpy提供常用的数值数组、矩阵等函数
numpy的优点:1、基于向量化的运算 2、进行数值运算时numpy数组比list效率高

scipy 是一种基于numpy的扩展 用来做高等数学、信号处理、优化、统计的扩展包比如:线性代数 统计的 空间的数据结构

Pandas 是一种构建于Numpy的高级数据结构和精巧工具,快速简单的处理数据 数据结构:Series和DataFrame

12、常用的高级数据分析库 nltk igraph scikit-learn

nltk 是做文本分析的 文本处理

natural language toolkit 自然语言处理工具包

igraph 社交网络分析

scikit-learn 机器学习模型的训练 算法的使用

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容