为什么我不能在熊猫函数中应用shift?
问题内容:
我试图建立一个使用.shift()的函数,但它给了我一个错误。考虑一下:
In [40]:
data={'level1':[20,19,20,21,25,29,30,31,30,29,31],
'level2': [10,10,20,20,20,10,10,20,20,10,10]}
index= pd.date_range('12/1/2014', periods=11)
frame=DataFrame(data, index=index)
frame
Out[40]:
level1 level2
2014-12-01 20 10
2014-12-02 19 10
2014-12-03 20 20
2014-12-04 21 20
2014-12-05 25 20
2014-12-06 29 10
2014-12-07 30 10
2014-12-08 31 20
2014-12-09 30 20
2014-12-10 29 10
2014-12-11 31 10
正常功能可以正常工作。为了演示我使用直接和函数方法两次计算相同的结果:
In [63]:
frame['horizontaladd1']=frame['level1']+frame['level2']#works
def horizontaladd(x):
test=x['level1']+x['level2']
return test
frame['horizontaladd2']=frame.apply(horizontaladd, axis=1)
frame
Out[63]:
level1 level2 horizontaladd1 horizontaladd2
2014-12-01 20 10 30 30
2014-12-02 19 10 29 29
2014-12-03 20 20 40 40
2014-12-04 21 20 41 41
2014-12-05 25 20 45 45
2014-12-06 29 10 39 39
2014-12-07 30 10 40 40
2014-12-08 31 20 51 51
2014-12-09 30 20 50 50
2014-12-10 29 10 39 39
2014-12-11 31 10 41 41
但是当直接应用shift可以工作时,在一个函数中它不起作用:
frame['verticaladd1']=frame['level1']+frame['level1'].shift(1)#works
def verticaladd(x):
test=x['level1']+x['level1'].shift(1)
return test
frame.apply(verticaladd)#error
结果是
KeyError: ('level1', u'occurred at index level1')
我还尝试将单个列应用于我认为更有意义的一列,但是没有运气:
def verticaladd2(x):
test=x-x.shift(1)
return test
frame['level1'].map(verticaladd2)#error, also with apply
错误:
AttributeError: 'numpy.int64' object has no attribute 'shift'
为什么不直接打电话接班?我需要将其嵌入到一个函数中以沿轴1同时计算多个列。请参阅相关问题布尔逻辑的含糊真值
问题答案:
尝试将框架传递给函数,而不是使用apply
(我不确定为什么apply
行不通,即使按列也不知道):
def f(x):
x.level1
return x.level1 + x.level1.shift(1)
f(frame)
返回:
2014-12-01 NaN
2014-12-02 39
2014-12-03 39
2014-12-04 41
2014-12-05 46
2014-12-06 54
2014-12-07 59
2014-12-08 61
2014-12-09 61
2014-12-10 59
2014-12-11 60
Freq: D, Name: level1, dtype: float64