由于许多潜在的pandas用户对SQL有一定的了 解 ,因此本页旨在提供一些使用pandas来执行各种SQL操作的示例。
小编推荐大家可以加我的扣扣群 735934841 ,免费领取Python视频资料
大部分的例子将利用tips在pandas测试中发现的数据集。我们将数据读入一个名为tips的DataFrame,并假设我们有一个同名和结构的数据库表。
一、SELECT
在SQL中,选择是使用逗号分隔的列表来选择(或者*选择所有列):
在pandas中,列的选择是通过传递列名到您的DataFrame:
调用没有列名称列表的DataFrame将显示所有列(类似于SQL的 *)。
二、WHERE
SQL中的过滤是通过WHERE子句完成的。
数据框dataframe可以通过多种方式进行过滤; 最直观的是使用 布尔索引。
上面的语句只是将一个SeriesTrue / False对象传递给DataFrame,所有行都返回True。
就像SQL的OR和AND一样,可以使用|将多个条件传递给DataFrame (OR)和&(AND)。
NULL检查使用notna()和isna()方法完成。
假设我们有一个与上面的DataFrame结构相同的表。我们只能看到col2 IS NULL 的记录与下面的查询:
获取col1不是NULL的项目可以完成notna()。