按列将函数应用于Pandas数据框


问题内容

我有一个函数想应用于熊猫数据框的某些列。因此,我不想显式说明列,而是要动态选择所需的列,然后调用该函数,例如

如何实现类似:

for column in dataframe:
    if column.name != 'manager':
       apply function():

问题答案:

我认为您可以先找到所有列list comprehension,然后:apply func

import pandas as pd

df = pd.DataFrame({'A':[1,2,3],
                   'B':[4,5,6],
                   'C':[7,8,9],
                   'D':[1,3,5],
                   'E':[5,3,6],
                   'F':[7,4,3]})

print (df)
   A  B  C  D  E  F
0  1  4  7  1  5  7
1  2  5  8  3  3  4
2  3  6  9  5  6  3

cols = [col for col in  df.columns if col != 'B']
print (cols)
['A', 'C', 'D', 'E', 'F']

def func(x):
    return x + 1

df[cols] = df[cols].apply(func)

print (df)
   A  B   C  D  E  F
0  2  4   8  2  6  8
1  3  5   9  4  4  5
2  4  6  10  6  7  4

布尔索引的另一种解决方案:

cols = df.columns[df.columns != 'B']
print (cols)
Index(['A', 'C', 'D', 'E', 'F'], dtype='object')