1、Anaconda下载路径
官网下载:https://www.anaconda.com/(网速好的可以从这里下载)
清华大学开源软件镜像站 :(网速不好的可以从这里下载)
https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
2、Anaconda Prompt打开方式(win8 64位系统环境下)
3、Anaconda 查看所有环境目录命令:conda env list
4、Anaconda 进入某一个环境目录命令:activate root(注意:root是环境名称,mac系统的是:source activate root)
5、Anaconda 查看某个环境下所安装的包:conda list
6、Anaconda 退出某个环境:deactivate
7、Anaconda 创建用户自己环境:conda create -n 名字(例如:conda create -n zlcpy3)
8、配置pycharm的工作环境
9、配置pycharm的文件模板
如何出现保存不了的情况,就把下面框中的文件删除掉
模板效果如下:
模板定义的参考文章:
https://www.cnblogs.com/jhao/p/6944383.html?utm_source=itdadao&utm_medium=referral
10、Anaconda 的基本使用
首先在命令行窗口进入自己创建的环境,然后按照numpy库
同样的安装方法,安装scipy、pandas等库
# -*- coding: utf-8 -*-
import numpy as np
from scipy import linalg
import pandas as pd
"""
-------------------------------------------------
File Name: test
Description :
Author : Lenovo
date: 2018/1/4
-------------------------------------------------
Change Activity:
2018/1/4:
-------------------------------------------------
"""
__author__ = 'Lenovo'
# numpy的简单应用
# 以前的写法
for i in range(10):
print(i)
# 0
# 1
# 2
# 3
# 4
# 5
# 6
# 7
# 8
# 9
# 现在的写法
print(np.arange(10))
# [0 1 2 3 4 5 6 7 8 9]
# 以前的写法
a = [1,2,3,4,5]
b = []
for i in a:
b.append(i**2)
print(b)
# [1, 4, 9, 16, 25]
# 现在的写法
a = np.arange(1,6)
print(a)
# [1 2 3 4 5]
print(a**2)
# [1, 4, 9, 16, 25]
# 行列式
a = np.array([[1,2],[3,4]])
print(a)
# [[1 2]
# [3 4]]
print(linalg.det(a))
# -2.0
# pandas的基本应用
s = pd.Series([2,3,5,np.nan,8,9])
print(s)
# 0 2.0
# 1 3.0
# 2 5.0
# 3 NaN
# 4 8.0
# 5 9.0
dates = pd.date_range("20171201",periods=7)
print(dates)
# dtype: float64
# DatetimeIndex(['2017-12-01', '2017-12-02', '2017-12-03', '2017-12-04',
# '2017-12-05', '2017-12-06', '2017-12-07'],
# dtype='datetime64[ns]', freq='D')
df = pd.DataFrame(np.random.randn(7,4),index=dates,columns=list('ABCD'))
print(df)
# A B C D
# 2017-12-01 -0.267794 -1.970909 -0.285059 0.583872
# 2017-12-02 0.509023 1.812721 -1.473795 1.039633
# 2017-12-03 0.162599 -0.294537 1.992656 -1.466471
# 2017-12-04 -1.220114 -0.798851 1.873921 1.024887
# 2017-12-05 -0.283632 -0.431764 -0.751009 -1.797970
# 2017-12-06 -0.894589 -0.158992 1.553444 -0.851872
# 2017-12-07 0.375514 2.119276 -1.144065 -0.228605
print(df.T)
# 2017-12-01 2017-12-02 2017-12-03 2017-12-04 2017-12-05 2017-12-06 2017-12-07
# A -0.267794 0.509023 0.162599 -1.220114 -0.283632 -0.894589 0.375514
# B -1.970909 1.812721 -0.294537 -0.798851 -0.431764 -0.158992 2.119276
# C -0.285059 -1.473795 1.992656 1.873921 -0.751009 1.553444 -1.144065
# D 0.583872 1.039633 -1.466471 1.024887 -1.797970 -0.851872 -0.228605
print(df.sort_values(by='B'))
# A B C D
# 2017-12-01 -0.267794 -1.970909 -0.285059 0.583872
# 2017-12-04 -1.220114 -0.798851 1.873921 1.024887
# 2017-12-05 -0.283632 -0.431764 -0.751009 -1.797970
# 2017-12-03 0.162599 -0.294537 1.992656 -1.466471
# 2017-12-06 -0.894589 -0.158992 1.553444 -0.851872
# 2017-12-02 0.509023 1.812721 -1.473795 1.039633
# 2017-12-07 0.375514 2.119276 -1.144065 -0.228605
11、numpy、scipy 、Pandas 的基本作用
numpy提供常用的数值数组、矩阵等函数
numpy的优点:1、基于向量化的运算 2、进行数值运算时numpy数组比list效率高
scipy 是一种基于numpy的扩展 用来做高等数学、信号处理、优化、统计的扩展包比如:线性代数 统计的 空间的数据结构
Pandas 是一种构建于Numpy的高级数据结构和精巧工具,快速简单的处理数据 数据结构:Series和DataFrame
12、常用的高级数据分析库 nltk igraph scikit-learn
nltk 是做文本分析的 文本处理
natural language toolkit 自然语言处理工具包
igraph 社交网络分析
scikit-learn 机器学习模型的训练 算法的使用