一、使用xlrd
1、导入模块
import xlrd
2、读取excel表格,里面包含多个子表
workbook = xlrd.open_workbook('D:/medic/check_分析.xlsx')
3、根绝子表名称获得表格数据
拿到第一个子表名称
sheet1_name = workbook.sheet_names()[0]
print(sheet1_name)
根据第一个表格名称获得表格数据
sheet1 = workbook.sheet_by_name(sheet1_name)
print(sheet1.name,sheet1.nrows,sheet1.ncols)
拿到指定行和指定列的数据
# 获得一行
rows = sheet1.row_values(0)
# print(rows)
print(len(rows)) # 539
# 获得一列
cols = sheet1.col_values(0)
print(len(cols))# 3066
统计表格中每列空格数据
for i in range(len(rows)):
cols = sheet1.col_values(i)
count_null = cols.count('')
# if 2500<count_null:
# print(i,count_null,sheet1.row_values(0)[i])
print(i,count_null,sheet1.row_values(0)[i])
二、使用pandas
1、导入模块
import pandas as pd
import numpy as np
2、加载表格
header=0 表示第0行为表头
data = pd.read_excel('D:/medic/check_f_foraccess.xlsx',header=0,nrows=17, usecols=3)
加载表格中名叫Sheet1的子表
data = pd.read_excel('D:/medic/check_f_foraccess.xlsx',sheet_name='Sheet1')
打印表格信息
data.shape
(3065, 22)
打印第0行表头
data[0:0]
打印某类的前10行
data['病历号'][0:10]