一个数据框的每个列的最大值和最小值


问题内容

给此数据框“ x”:

    col1 col2 col3 col4
    0     5   -2    1 
   -5     2   -1    9
    3    -7    3    5

如何获得每列的最小值和最大值的配对列表?结果将是:

list = [ [-5 , 3], [-7 , 5], [-2 , 3], [1 , 9] ]

问题答案:

您可以定义一个函数并调用apply传递函数名,这将创建一个以min和max为索引名的df:

In [203]:

def minMax(x):
    return pd.Series(index=['min','max'],data=[x.min(),x.max()])


df.apply(minMax)
Out[203]:
     col1  col2  col3  col4
min    -5    -7    -2     1
max     3     5     3     9

如果您坚持使用列表列表,我们可以转置df并将值转换为列表:

In [206]:

def minMax(x):
    return pd.Series(index=['min','max'],data=[x.min(),x.max()])


df.apply(minMax).T.values.tolist()
Out[206]:
[[-5, 3], [-7, 5], [-2, 3], [1, 9]]

函数本身并不是完全必要的,因为您可以使用lambda代替:

In [209]:

df.apply(lambda x: pd.Series([x.min(), x.max()])).T.values.tolist()
Out[209]:
[[-5, 3], [-7, 5], [-2, 3], [1, 9]]

另请注意,您可以使用describeloc获取所需的内容:

In [212]:

df.describe().loc[['min','max']]
Out[212]:
     col1  col2  col3  col4
min    -5    -7    -2     1
max     3     5     3     9