2 votes

Comment soustraire la valeur d'une colonne à chaque valeur d'une autre colonne (pandas)

J'ai deux colonnes A et B. Je veux soustraire la valeur de la colonne B de chaque valeur de la colonne A et créer une nouvelle colonne sans utiliser la boucle for.

Voici mon Dataframe

    A   B
0   5   3
1   3   2
2   8   1

Sortie souhaitée

    A   B   C   D   E
0   5   3   2   3   4   
1   3   2   0   1   2
2   8   1   5   6   7

C = A - B[0]
D = A - B[1]
E = A - B[2]

3voto

AndyK Points 1677

Utiliser le tableau de numpy diffusion :

df = pd.DataFrame({'A':[5, 3, 8],
                   'B':[3, 2, 1]})

df2 = pd.DataFrame(df['A'].values[:, None] - df['B'].values, columns=['C', 'D', 'E'])

df = df.join(df2)

Résultat :

   A  B  C  D  E
0  5  3  2  3  4
1  3  2  0  1  2
2  8  1  5  6  7

Explication :

>>> df['A'].values[:, None]

array([[5],
       [3],
       [8]])

>>> df['B'].values

array([3, 2, 1])

Lorsqu'on les soustrait, numpy "étire" df['A'].values[:, None] à :

array([[5, 5, 5],
       [3, 3, 3],
       [8, 8, 8]])

y df['B'].values à :

array([[3, 2, 1],
       [3, 2, 1],
       [3, 2, 1]])

et le résultat de la soustraction est :

array([[2, 3, 4],
       [0, 1, 2],
       [5, 6, 7]])

0voto

Josh Friedlander Points 3255

Voilà :

d = pd.DataFrame.from_dict({'A': {0: 5, 1: 3, 2: 8}, 'B': {0: 3, 1: 2, 2: 1}})
m = d.shape[0]
cols = [chr(67 + x) for x in range(m)]
d.join(pd.DataFrame(np.broadcast_to(d['A'], (m, m)).T - np.broadcast_to(d['B'], (m, m)), columns=cols))

Explication : diffuse chaque série dans une matrice 3x3 et les soustrait, en fait un dataframe et le joint à l'original. Les colonnes sont générées automatiquement.

0voto

sammywemmy Points 14854

Cela pourrait aider :
1. répliquer la colonne A, en fonction de la longueur de la trame de données
2. convertir B en un tableau numpy
3. Soustrayez B de A, ce qui devrait vous donner notre soustraction par ligne.
4. concaténation vers les données principales

temp = pd.concat([df.A]*len(df), axis=1).sub(df.B.to_numpy())
final = pd.concat([df,temp], axis=1).set_axis(['A','B','C','D','E'],axis='columns')
final

    A   B   C   D   E
0   5   3   2   3   4
1   3   2   0   1   2
2   8   1   5   6   7

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X