使用给定的timedelta重新采样时间序列
问题内容:
我正在使用Pandas来构建和处理数据。这是我的DataFrame:
我想对时间序列数据进行重新采样,并从头到尾(beginning_time / end_time)为每个ID(在此命名为“
3”)具有所有比特率得分。例如,对于第一行,我想拥有从2016-07-08 02:17:42到2016-07-08
02:17:55的所有秒数,同时具有相同的比特率得分和相同的ID 。像这样的东西:
例如,给定:
df = pd.DataFrame(
{'Id' : ['CODI126640013.ts', 'CODI126622312.ts'],
'beginning_time':['2016-07-08 02:17:42', '2016-07-08 02:05:35'],
'end_time' :['2016-07-08 02:17:55', '2016-07-08 02:26:11'],
'bitrate': ['3750000', '3750000']})
这使 :
我想在第一行:
secend行也是如此。因此,目标是在开始时间和结束时间之间对deltaTime进行重新采样,当然,比特率分数必须相同。
我正在尝试以下代码:
df['new_beginning_time'] = pd.to_datetime(df['beginning_time'])
df.set_index('new_beginning_time').groupby('Id', group_keys=False).apply(lambda df: df.resample('S').ffill()).reset_index()
但是在这种情况下,它没有用!有任何想法吗 ?非常感谢你 !
问题答案:
您可以使用melt
带有resample
-
0.18.1版本的大熊猫
:
df.beginning_time = pd.to_datetime(df.beginning_time)
df.end_time = pd.to_datetime(df.end_time)
df = pd.melt(df, id_vars=['Id','bitrate'], value_name='dates').drop('variable', axis=1)
df.set_index('dates', inplace=True)
print(df)
Id bitrate
dates
2016-07-08 02:17:42 CODI126640013.ts 3750000
2016-07-08 02:05:35 CODI126622312.ts 3750000
2016-07-08 02:17:55 CODI126640013.ts 3750000
2016-07-08 02:26:11 CODI126622312.ts 3750000
print (df.groupby('Id').resample('1S').ffill())
Id bitrate
Id dates
CODI126622312.ts 2016-07-08 02:05:35 CODI126622312.ts 3750000
2016-07-08 02:05:36 CODI126622312.ts 3750000
2016-07-08 02:05:37 CODI126622312.ts 3750000
2016-07-08 02:05:38 CODI126622312.ts 3750000
2016-07-08 02:05:39 CODI126622312.ts 3750000
2016-07-08 02:05:40 CODI126622312.ts 3750000
2016-07-08 02:05:41 CODI126622312.ts 3750000
2016-07-08 02:05:42 CODI126622312.ts 3750000
2016-07-08 02:05:43 CODI126622312.ts 3750000
2016-07-08 02:05:44 CODI126622312.ts 3750000
2016-07-08 02:05:45 CODI126622312.ts 3750000
2016-07-08 02:05:46 CODI126622312.ts 3750000
2016-07-08 02:05:47 CODI126622312.ts 3750000
...
...