Comment supprimer les lignes qui apparaissent sur le fichier B à partir d'un autre fichier A ?

Question

Comment supprimer les lignes qui apparaissent sur le fichier B à partir d'un autre fichier A ?

Demandé el 6 de Décembre, 2010: Quand la question a-t-elle été
9048 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'ai un grand fichier A (composé de courriers électroniques), une ligne pour chaque courrier. J'ai également un autre fichier B qui contient une autre série de messages.

Quelle commande dois-je utiliser pour supprimer du fichier A toutes les adresses qui apparaissent dans le fichier B.

Ainsi, si le fichier A contient :

A
B
C

et le dossier B contenu :

B    
D
E

Dans ce cas, le fichier A devrait être laissé avec :

A
C

Je sais que c'est une question qui aurait pu être posée plus souvent, mais je n'ai trouvé que une commande en ligne qui m'a donné une erreur avec un mauvais délimiteur.

Toute aide serait très appréciée ! Quelqu'un trouvera certainement une solution intelligente, mais je ne suis pas un expert en shell.

Demandé el 6 de Décembre, 2010 par slhck

1 votes

Duplication possible de Suppression des lignes d'un fichier qui se trouvent dans un autre fichier

Commenté el 5 de Octobre, 2014 par tripleee

1 votes

La plupart des réponses ici concernent des fichiers triés, et la plus évidente est manquante, ce qui n'est bien sûr pas de votre faute, mais qui rend l'autre plus généralement utile.

Commenté el 5 de Octobre, 2014 par tripleee

Answer 1

5 Réponses

Answer 2

8voto

peak Points 71

Cette amélioration de la réponse de @karakfa peut être sensiblement plus rapide pour les très gros fichiers. Comme pour cette réponse, aucun fichier n'a besoin d'être trié, mais la vitesse est assurée grâce aux tableaux associatifs d'awk. Seul le fichier de recherche est conservé en mémoire.

Cette formulation permet également d'envisager qu'un seul champ particulier ($N) du fichier d'entrée soit utilisé pour la comparaison.

# Print lines in the input unless the value in column $N
# appears in a lookup file, $LOOKUP;
# if $N is 0, then the entire line is used for comparison.

awk -v N=$N -v lookup="$LOOKUP" '
  BEGIN { while ( getline < lookup ) { dictionary[$0]=$0 } }
  !($N in dictionary) {print}'

(Un autre avantage de cette approche est qu'il est facile de modifier le critère de comparaison, par exemple pour supprimer les espaces blancs de début et de fin).

Répondu el 29 de Décembre, 2015 par peak (71 Points )

Answer 3

2voto

HelloGoodbye Points 226

Vous pouvez utiliser Python :

python -c '
lines_to_remove = set()
with open("file B", "r") as f:
    for line in f.readlines():
        lines_to_remove.add(line.strip())

with open("file A", "r") as f:
    for line in [line.strip() for line in f.readlines()]:
        if line not in lines_to_remove:
            print(line)
'

Répondu el 10 de Août, 2017 par HelloGoodbye (226 Points )

Answer 4

2voto

Darpan Points 709

Vous pouvez utiliser - diff fileA fileB | grep "^>" | cut -c3- > fileA

Cela fonctionnera également pour les fichiers qui ne sont pas triés.

Répondu el 30 de Mars, 2018 par Darpan (709 Points )

Answer 5

2voto

Rafael Points 2799

Pour compléter la réponse de Python à l'utilisateur ci-dessus, voici une solution plus rapide :

    python -c '
lines_to_remove = None
with open("partial file") as f:
    lines_to_remove = {line.rstrip() for line in f.readlines()}

remaining_lines = None
with open("full file") as f:
    remaining_lines = {line.rstrip() for line in f.readlines()} - lines_to_remove

with open("output file", "w") as f:
    for line in remaining_lines:
        f.write(line + "\n")
    '

Augmenter la puissance de la soustraction des ensembles.

Répondu el 11 de Février, 2021 par Rafael (2799 Points )

Answer 6

0voto

Kiruthika kanagarajan Points 189

Pour obtenir le fichier après avoir supprimé les lignes qui apparaissent sur un autre fichier

comm -23 <(sort bigFile.txt) <(sort smallfile.txt) > diff.txt

Répondu el 11 de Mai, 2021 par Kiruthika kanagarajan (189 Points )

Comment supprimer les lignes qui apparaissent sur le fichier B à partir d'un autre fichier A ?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment supprimer les lignes qui apparaissent sur le fichier B à partir d'un autre fichier A ?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: