Pandas支持三种排序方式,按索引标签排序,按值排序,按两种方式混合排序。
按索引排序
Series.sort_index()与DataFrame.sort_index方法用于按索引层级对Pandas对象排序。
按值排序
Series.sort_values()方法用于按值对Series排序。DataFrame.sort_values()方法用于按行列的值对DataFrame排序。DataFrame.sort_values()的可选参数by用于指定按哪列排序,该参数的值可以是一列或多列数据。
参数by支持列名列表
这些方法支持用na_position参数处理空值。
按索引与值排序
通过参数by传递给DataFrame.sort_values()的字符串可以引用列或索引层名。
按second(索引)与A(列)排序。
搜索排序
Series支持searchsorted()方法,这与numpy.ndarray.searchsorted()的操作方法类似。
最大值与最小值
Series支持nsmallest()与nlargest()方法,该方法返回N个最大值或最小值。对于数据量大的Series来说,该方法比先为整个Series排序,再调用head(n)这种方式的速度要快得多。
DataFrame也支持nlargest与nsmallest方法。
用多层索引的列排序
列为多层索引时,可以显式排序,用by指定所有层级。
如果你想学习Python,但是找不到学习路径和资源,欢迎来指尖编程。
高效的在线交互式学Python。