J'ai un cadre de données très similaire à celui ci-dessous :
Date Col1 Col2 Col3 ...
2020/11/04 -10 0 12
2020/11/05 31 12 42
2020/11/07 10 1 -12
2020/11/08 2 -15 1
2020/11/09 2 10 0
.
.
.
Ma condition de somme est la suivante : lors du calcul de la somme pour la ligne suivante, si la somme est négative changez-le en 0. La sortie de l'opération devrait ressembler à ce qui suit.
Date Col1 Col2 Col3 ...
2020/11/04 0 0 12
2020/11/05 31 12 54
2020/11/07 41 13 42
2020/11/08 43 0 43
2020/11/09 45 10 43
.
.
.
J'y suis parvenu en bouclant et en appliquant des conditions à chaque ligne et colonne, mais pour les données volumineuses, les performances sont très faibles.
columns = diff.columns
for col in columns:
if diff.iloc[0].at[col] < 0:
diff.iloc[0].at[col] = 0
for i,row in diff.iterrows():
if not i == diff.first_valid_index():
prev = diff.index.get_loc(i) - 1
for col in columns:
diff.loc[i].at[col] = diff.loc[i].at[col] + diff.iloc[prev].at[col]
if diff.loc[i].at[col] < 0:
diff.loc[i].at[col] = 0
Comment puis-je faire mieux dans les pandas ?
UPDATE ce fil aquí est très pertinente et ma solution est la suivante :
def adj_func(x):
total = 0
result = []
for i, y in enumerate(x):
total += y
if total < 0:
total = 0
result.append(total)
return result
diff[col_list].apply(adj_func)