2 votes

Pandas récupère l'index de la ligne ajoutée à partir du rééchantillonnage.

J'ai un cadre de données avec des lignes manquantes que j'interpole et rééchantillonne. J'aimerais savoir s'il existe un moyen de récupérer l'index des lignes qui sont ajoutées au cadre de données lorsque je le rééchantillonne ?

C'est ainsi que je crée/rééchantillonne/interpelle le cadre de données :

import numpy as np
import pandas as pd
from datetime import *

# Create df and drop a few rows
rng = pd.date_range('2000-01-01', periods=365, freq='D')
df = pd.DataFrame({'Val': np.random.randn(len(rng)) },index = rng)
df = df.drop([datetime(2000,1,5),datetime(2000,1,24)])

df = df.resample('D').interpolate(method='linear')

2voto

Asish M. Points 926

Vous pouvez obtenir les éléments d'index supplémentaires en prenant l'élément différence entre les nouveaux et les anciens

In [16]: df_new = df.resample('D').interpolate(method='linear')

In [17]: df_new.index.difference(df.index)
Out[17]: DatetimeIndex(['2000-01-05', '2000-01-24'], dtype='datetime64[ns]', freq=None)

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X