Supprimer les entrées en double dans un script Bash

Question

Supprimer les entrées en double dans un script Bash

Demandé el 21 de Février, 2012: Quand la question a-t-elle été
201064 affichage: Nombre de visites la question a
4 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Cette question a déjà des réponses:

Comment supprimer les lignes dupliquées dans un fichier sans le trier sous Unix ? (5 réponses )

Je souhaite supprimer les entrées en double d'un fichier texte, par exemple :

 kavitha= Tue Feb    20 14:00 19 IST 2012  (duplicate entry) 
sree=Tue Jan  20 14:05 19 IST 2012  
divya = Tue Jan  20 14:20 19 IST 2012  
anusha=Tue Jan 20 14:45 19 IST 2012 
kavitha= Tue Feb    20 14:00 19 IST 2012 (duplicate entry)

Existe-t-il un moyen de supprimer les entrées en double à l'aide d'un script Bash ?

Sortie désirée

 kavitha= Tue Feb    20 14:00 19 IST 2012 
sree=Tue Jan  20 14:05 19 IST 2012  
divya = Tue Jan  20 14:20 19 IST 2012  
anusha=Tue Jan 20 14:45 19 IST 2012

Demandé el 21 de Février, 2012 par chinchu

Answer 1

4 Réponses

Answer 2

464voto

kev Points 41855

Vous pouvez sort puis uniq :

 $ sort -u input.txt

Ou utilisez awk :

 $ awk '!a[$0]++' input.txt

Répondu el 21 de Février, 2012 par kev (41855 Points )

Answer 3

19voto

Siva Charan Points 10518

Il supprime les lignes consécutives en double d'un fichier (émule "uniq"). La première ligne d'un ensemble de lignes en double est conservée, les autres sont supprimées.

 sed '$!N; /^\(.*\)\n\1$/!P; D'

Répondu el 21 de Février, 2012 par Siva Charan (10518 Points )

Answer 4

12voto

Chris Koknat Points 1732

Une ligne Perl similaire à la solution awk de @kev :

 perl -ne 'print if ! $a{$_}++' input

Cette variante supprime les espaces de fin avant de comparer :

 perl -lne 's/\s*$//; print if ! $a{$_}++' input

Cette variante modifie le fichier sur place :

 perl -i -ne 'print if ! $a{$_}++' input

Cette variante modifie le fichier sur place et effectue une sauvegarde input.bak

 perl -i.bak -ne 'print if ! $a{$_}++' input

Répondu el 9 de Septembre, 2015 par Chris Koknat (1732 Points )

Answer 5

0voto

potong Points 18653

Cela pourrait fonctionner pour vous:

 cat -n file.txt |
sort -u -k2,7 |
sort -n |
sed 's/.*\t/    /;s/\([0-9]\{4\}\).*/\1/'

ou ca:

  awk '{line=substr($0,1,match($0,/[0-9][0-9][0-9][0-9]/)+3);sub(/^/,"    ",line);if(!dup[line]++)print line}' file.txt

Répondu el 21 de Février, 2012 par potong (18653 Points )

Supprimer les entrées en double dans un script Bash

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Supprimer les entrées en double dans un script Bash

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: