python入门挣扎指南 - 安装及直方图

小白上路挣扎指南:

  1. 安装anaconda,详见简书余欣博士文章 ,安装过程中涉及的如在哪输入命令行等问题,还可参阅唐瑟同学的这篇入门分享
  2. 安装Jupyter notebook,详见简书余欣博士文章,关于安装了Python 2环境后,如何在Jupyter notebook中实现的问题,参考这篇文章,如1中所述安装好py2环境后,activate py2,之后输入conda install notebook ipykernel,进一步选y,最后ipython kernel install --user,即可在jupyter notebook中选择py2的环境了。
    Paste_Image.png
  3. 启动Jupyter notebook
  4. 加载Python包
import pandas as pd #导入pandas包,命名为pd。
import numpy as np #导入numpy,命名为np。
import matplotlib.pyplot as plt #导入matplotlib.pyplot,命名为plt。
from scipy import stats #从scipy导入stats 
  1. 导入数据
weight_data = pd.read_table('weight.txt') #用pd读取文件,命名为weight_data
weight_data.shape    # 展示DataFrame的维度
  1. 数据处理
weight_data['weight'].mean() #求均值
weight_data['weight'].var() #求方差
  1. 数据可视化
fig = plt.figure() #创造画布fig
plt.rcParams["font.family"] = "SimHei" #修改默认字体,以正确显示中文(参考自小密圈中@木子 同学的分享)
x = weight_data['weight'] #以x代表weight_data表中weight栏
ax = fig.add_subplot(111) #将分为1*1的画布上自左向右自上向下第1格画图命名为ax,若改为234,即将画布分为2*3的格子,在第4格子填入ax
numBins = 10 #柱的数目(最终将生成此数+1的edge),此处亦可输入[0,40,50,90],定制尺度的分布
ax.hist(x,numBins,color='blue',alpha=0.2) #alpha是透明度设置
plt.title(u'体重直方图') #设置绘图标题 
plt.show() #展示图

结果展示:

体重文件的数据分析及展示部分

数据特征:众数落在40~50,小于平均值50.7,是右偏的。体重较高的会和大多数众数差得比较远。

附加:读取csv文件

先看看表中文件的具体样式
进一步的数据处理及可视化

数据特征:依然是一个右偏分布,极大值偏离很远,这对航空运力是很大的挑战,峰值管理并不好做,运力峰值和日常运力的协调应该会比较难。

包的介绍

pandas,全称Python Data Analysis Librarylist,是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。

NumPy,全称Numeric Python,是Python的一种开源的数值计算扩展。可用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效,因array只能由存储相同的数据类型,利用内存更高效。同时numpy跟C/C++和Fortran代码的工具包可通融。numpy和稀疏矩阵运算包scipy配合更佳方便。

Matplotlib是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。可以方便地生成绘图,直方图,功率谱,条形图,错误图,散点图等。matplotlib的pyplot子库提供了和matlab类似的绘图API,方便用户快速绘制2D图表。matplotlib.pyplot是命令行式函数的集合,每一个函数都对图像作了修改,比如创建图形,在图像上创建画图区域,在画图区域上画线,在线上标注等。

SciPy函数库在NumPy库的基础上增加了众多的数学、科学以及工程计算中常用的库函数。例如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等等。

help()和dir()

method的查询,比如dir(list),会把list的所有方法列出,help(list.append)可以查看具体的。设a=abc.def,则help(a)亦可查询帮助。
导入包的情况,若查询类型是pandas.core.frame.DataFrame,但已经导入为pd,则help文件使用时也需在type部分写为pd,如help(pd.core.frame.DataFrame.shape),或者可以直接在浏览器搜索panda shape也可。

import和from import

import xx导入模块对于模块中的函数,每次调用需要“模块.函数”来用。
from xx import fun 直接导入模块中某函数,直接fun()就可用。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,294评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,493评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,790评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,595评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,718评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,906评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,053评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,797评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,250评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,570评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,711评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,388评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,018评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,796评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,023评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,461评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,595评论 2 350

推荐阅读更多精彩内容