Comment incrémenter automatiquement un compteur par des valeurs répétées dans une colonne

Question

Comment incrémenter automatiquement un compteur par des valeurs répétées dans une colonne

Demandé el 7 de Février, 2022: Quand la question a-t-elle été
58 affichage: Nombre de visites la question a
3 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'ai un data frame avec la colonne name et j'ai besoin de créer la colonne seq, qui me permet d'identifier les différentes fois où un nom apparaît dans le data frame, il est important de préserver l'ordre.

import pandas as pd  

data = {'name': ['Tom', 'Joseph','Joseph','Joseph', 'Tom', 'Tom', 'John','Tom','Tom','John','Joseph']
        , 'seq': ['Tom 0', 'Joseph 0','Joseph 0','Joseph 0', 'Tom 1', 'Tom 1', 'John 0','Tom 2','Tom 2','John 1','Joseph 1']}  

df = pd.DataFrame(data)  

print(df) 

      name       seq
0      Tom     Tom 0
1   Joseph  Joseph 0
2   Joseph  Joseph 0
3   Joseph  Joseph 0
4      Tom     Tom 1
5      Tom     Tom 1
6     John    John 0
7      Tom     Tom 2
8      Tom     Tom 2
9     John    John 1
10  Joseph  Joseph 1

Demandé el 7 de Février, 2022 par Daniel Garavito

Answer 1

3 Réponses

Answer 2

2voto

Corralien Points 6849

Créez un masque booléen pour savoir si le nom a changé par rapport à la ligne précédente. Ensuite, filtrez les deuxième, troisième, ... noms d'une séquence avant de regrouper par nom. cumcount incrémente le numéro de séquence et concatène enfin le nom et le numéro de séquence.

# Masque booléen
m = df['name'].ne(df['name'].shift())

# Créer le numéro de séquence
seq = df.loc[m].groupby('name').cumcount().astype(str) \
        .reindex(df.index, fill_value=pd.NA).ffill()

# Concaténer le nom et le seq
df['seq'] = df['name'] + ' ' + seq

Sortie :

>>> df
      name       seq
0      Tom     Tom 0
1   Joseph  Joseph 0
2   Joseph  Joseph 0
3   Joseph  Joseph 0
4      Tom     Tom 1
5      Tom     Tom 1
6     John    John 0
7      Tom     Tom 2
8      Tom     Tom 2
9     John    John 1
10  Joseph  Joseph 1

>>> m
0      True
1      True
2     False
3     False
4      True
5     False
6      True
7      True
8     False
9      True
10     True
Name: name, dtype: bool

Répondu el 7 de Février, 2022 par Corralien (6849 Points )

Answer 3

1voto

ansev Points 26199

Vous devez vérifier l'existence d'un nouveau nom, puis créer un nouvel index pour chaque nom en utilisant groupby et cumsum, la série de chaînes résultante peut être concaténée avec str.cat

df['seq'] = df['name'].str.cat(
    df['name'].ne(df['name'].shift()).groupby(df['name']).cumsum().sub(1).astype(str),
    sep=' '
)

Répondu el 7 de Février, 2022 par ansev (26199 Points )

Answer 4

0voto

Zoff Dino Points 5010

En supposant que votre data frame soit indexé séquentiellement (0, 1, 2, 3, ...):

Groupez le data frame par name
Pour chaque groupe, appliquez un algorithme de lacunes et d'îlots : chaque fois que l'index saute de plus de 1, créez un nouvel îlot

def sequencer(group): idx = group.index.to_series()

Chaque fois que l'index a une lacune >1, crée un nouvel îlot
```
return idx.diff().ne(1).cumsum().sub(1)
```
seq = df.groupby('name').apply(sequencer).droplevel(0).rename('seq') df.merge(seq, left_index=True, right_index=True)

Répondu el 7 de Février, 2022 par Zoff Dino (5010 Points )

Comment incrémenter automatiquement un compteur par des valeurs répétées dans une colonne

Réponses

Chaque fois que l'index a une lacune >1, crée un nouvel îlot

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment incrémenter automatiquement un compteur par des valeurs répétées dans une colonne

Réponses

Chaque fois que l'index a une lacune >1, crée un nouvel îlot

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: