如何在数据框列中删除字符串的子字符串?


问题内容

我有这个简化的数据框:

ID, Date
1 8/24/1995
2 8/1/1899 :00

如何利用熊猫的力量来识别数据框中包含多余日期的任何日期并将其:00删除。

任何想法如何解决这个问题?

我已经尝试过这种语法,但没有帮助:

df[df["Date"].str.replace(to_replace="\s:00", value="")]

输出应类似于:

ID, Date
1 8/24/1995
2 8/1/1899

问题答案:

您需要将修剪后的列分配回原始列,而不是进行子集设置,而且该str.replace方法似乎没有to_replaceandvalue参数。它具有patrepl参数:

df["Date"] = df["Date"].str.replace("\s:00", "")

df
#   ID       Date
#0   1  8/24/1995
#1   2   8/1/1899