大熊猫堆栈与行号
问题内容:
我有一个Pandas DataFrame示例:
A B C D
0 0.441040 0.235533 -0.899417 1.960367
1 -0.701764 2.343389 1.293865 0.556737
2 -0.511988 -0.260338 0.201938 1.154131
3 1.001099 1.077759 -0.006872 -0.961884
4 0.914676 -0.445287 -1.618399 -0.616381
5 0.360060 -0.082711 1.010578 1.071003
最后,我希望将某些列与上面关联的行号堆叠在一起。使用列选择和堆栈非常接近:
df[['B','C']].stack()
0 B 0.235533
C -0.899417
1 B 2.343389
C 1.293865
2 B -0.260338
C 0.201938
3 B 1.077759
C -0.006872
4 B -0.445287
C -1.618399
5 B -0.082711
C 1.010578
但我希望将行号与每一行相关联,因为将下面的每一行与原始数据框/表相关联非常重要:
0 B 0.235533
0 C -0.899417
1 B 2.343389
1 C 1.293865
2 B -0.260338
2 C 0.201938
3 B 1.077759
3 C -0.006872
4 B -0.445287
4 C -1.618399
5 B -0.082711
5 C 1.010578
我不确定如何将df [[‘’B’,’C’]]。stack()转换为我想要的内容,并将其与每行关联的原始行号/索引。
最后,我想将输出写到具有行号关联的CSV文件中。
问题答案:
pandas.DataFrame.reset_index
将多级索引推入列中。它也适用pandas.Series
。
df[['B', 'C']].stack().reset_index()