Supprimer les lignes en double #2

Question

Supprimer les lignes en double #2

Demandé el 27 de Janvier, 2011: Quand la question a-t-elle été
4165 affichage: Nombre de visites la question a
3 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'ai une table (grande ~1 000 000 lignes) qui contient potentiellement des lignes dupliquées (valeurs NULL possibles).

Ce que je veux faire, c'est ceci :

Ne sélectionner que les lignes distinctes.
Supprimer les lignes dont le champ "id" est dupliqué.

Prenons une table :

id | a | b    
1  | 2 | 3    
2  | 8 | 7    
3  | 9 | 10    
2  | 8 | 7    
3  | 20| 12

Ce que je veux obtenir, c'est.. :

id | a | b    
1  | 2 | 3    
2  | 8 | 7

La ligne avec l'identifiant 2 est conservée dans une copie, tandis que les lignes avec l'identifiant 3 ont été supprimées.

Je pensais à.. :

SELECT DISTINCT id, a, b FROM table pour n'obtenir que des lignes distinctes.
Filtrer d'une manière ou d'une autre le résultat de (1) pour supprimer les identifiants en double.

Quelle serait la meilleure façon de procéder ?

Demandé el 27 de Janvier, 2011 par Petr

Answer 1

3 Réponses

Answer 2

2voto

jzd Points 17369

Troisième réponse maintenant que la question est un peu plus claire :

SELECT id, min(a) as a, min(b) as b
FROM (SELECT DISTINCT id, a, b FROM table) t
GROUP BY id
HAVING count(*) =1

Répondu el 27 de Janvier, 2011 par jzd (17369 Points )

Answer 3

0voto

DRapp Points 23901

Petr, il semblerait, d'après les commentaires, que vous souhaitiez une COMBINAISON...

I Toutes les lignes où l'ID n'apparaît qu'une seule fois. Toutes les lignes où l'identifiant apparaît PLUS d'une fois -- ET tous les autres champs de l'enregistrement sont identiques.

E Toute ligne où l'ID apparaît plus d'une fois -- ET où les autres champs ne correspondent pas exactement.

select ID, min(a) a, min(b) b
    from YourTable
    group by ID
    having min(a) = max(a)
       and min(b) = max(b)

Si vous avez d'autres colonnes que a et b à comparer, il vous suffit d'ajouter les valeurs respectives à la liste des champs de sélection et au champ correspondant. D'après l'échantillon de données que vous avez fourni, les valeurs renvoyées par la requête seraient les suivantes

ID  MIN(A)  MIN(B)    Having MIN(A)  MAX(A)  MIN(B)  MAX(B)
1    2        3                2        2       3      3 
2    8        7                8        8       7      7
3    9       10                9       20      10     12

Ainsi, la ligne ID = 3 sera rejetée puisque l'avoir échouera sur un même min() et max() de la même colonne sur les DEUX colonnes. Vous pouvez ensuite copier ces données dans un nouveau tableau. Un seul passage dans le tableau...

Répondu el 27 de Janvier, 2011 par DRapp (23901 Points )

Answer 4

0voto

SK9 Points 9683

Pouvez-vous reconstruire la base de données, ou sinon en créer une nouvelle à partir de l'originale, avec l'identifiant comme clé primaire ? SQL peut s'occuper du reste.

Répondu el 27 de Janvier, 2011 par SK9 (9683 Points )

Supprimer les lignes en double #2

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Supprimer les lignes en double #2

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: