python基础回顾-数据处理【四】

24:numpy:预处理
https://www.jianshu.com/p/83c8ef18a1e8
安装pip: https://jingyan.baidu.com/album/ff42efa9d630e5c19e220207.html?picindex=1
安装模块:

image.png

import numpy as np

arr1 =np.array([2,3,4])

print( arr1)
print ( arr1.dtype)
#int 32 整形
#获取数据类型
arr2 = np.array([ 1.2, 2.3 , 3.4])
#
print( arr2)
#列表计算
print( arr2.dtype)
#float64
print ( arr1 + arr2)
#
print( arr2 * 10 )
#
#
data = [[1,2,3], [4,5,6]]
arr3 = np.array(data)
print( arr3)
print ( arr3.dtype)
print ( arr3.shape)
#
#0矩阵 3行5列
print (np.zeros((3,5)))
#1矩阵 4行6列
print( np.ones((4,6)))
#生成随机矩阵
print(np.empty((2,3,2)))


#建数组
arr4 = np.arange(10)
#5到8 替换值
arr4[5:8] = 10

print(arr4)
#copy
arr_slice = arr4[5:8].copy()
#全部替换
arr_slice[:] = 15

print(arr_slice)
print(arr4)

25:pandas
Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法.

from pandas import Series, DataFrame
import pandas as pd


obj = Series([4, 5, 6, -7])

#print(obj)
#
# print( obj.index)
#
# print ( obj.values)
#
#key不能时序列
# {['a']:1}
#

obj2 = Series([4, 7, -5, 3], index=['d', 'b', 'c', 'a'])

#print(obj2)
#修改对于的value
# obj2['c'] = 6
#
# print(obj2)
#
# print ('f' in obj2)


sdata = {
    'beijing': 35000,
    'shanghai': 71000,
    'guangzhou': 16000,
    'shenzhen': 5000}
obj3 = Series(sdata)
#print( obj3)
#修改key
obj3.index = ['bj', 'gz', 'sh', 'sz']
#
#print( obj3)


data = {'city': ['shanghai', 'shanghai', 'shanghai', 'beijing', 'beijing'],
        'year': [2016, 2017, 2018, 2017, 2018],
        'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}
#字典传化 多维数组
frame = DataFrame(data)
#排序 年  城西   pop
frame2 = DataFrame(data, columns=['year', 'city', 'pop'])


#print(frame)
#
#print(frame2)
#
# print(frame2['city'])
# print(frame2.year)
#新加一列 并都赋值100
frame2['new'] = 100

#print(frame2)
#新加一列 并判断city是否时beijing
frame2['cap'] = frame2.city == 'beijing'

#print( frame2)

pop = {'beijing': {2008: 1.5, 2009: 2.0},
       'shanghai': {2008: 2.0, 2009: 3.6}
       }

frame3 = DataFrame(pop)
#print(frame3)
#T用于坐标互换  二维数组
#print(frame3.T)

obj4 = Series([4.5, 7.2, -5.3, 3.6], index=['b', 'd', 'c', 'a'])
#根据该索引排序 并且nan的值设置为0
obj5 = obj4.reindex(['a', 'b', 'c', 'd', 'e'], fill_value=0)

#print(obj5)
#设置key 024 以及value的数组
obj6 = Series(['blue', 'purple', 'yellow'], index=[0, 2, 4])

#输出range为6的 value 并向下补全  ffill向上补全
#print( obj6.reindex(range(6),method='ffill'))

from numpy import nan as NA

data = Series([1, NA, 2])
#删除缺失值dropna   NAN
#print(data)
#print(data.dropna())

data2 = DataFrame([[1., 6.5, 3], [1., NA, NA], [NA, NA, NA]
                   ])
#新加一列 4 并赋缺失
data2[4] = NA
#print(data2)
#删除整行都是缺失值
#print(data2.dropna(how='all'))
#整列都是缺失值的删除
#print(data2.dropna(axis=1, how='all'))
#
#data2.fillna(0)
#将缺失值赋值为0 输出
#print(data2.fillna(0, inplace=True))
#print(data2)


#层次化索引()
import numpy as np

data3 = Series(np.random.randn(10),
               index=[['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'd', 'd'],
                      [1, 2, 3, 1, 2, 3, 1, 2, 2, 3]])

print(data3)
#转化为二维数据DataFrame
print(data3.unstack())
#二维数据再转化回来。
print(data3.unstack().stack())

#输出b到c 的数据
print(data3['b':'c'])
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,686评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,668评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,160评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,736评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,847评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,043评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,129评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,872评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,318评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,645评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,777评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,861评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,589评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,687评论 2 351

推荐阅读更多精彩内容