Je veux conserver tous les identifiants en double, sauf s'il n'y a pas de nouvelles informations en raison de valeurs manquantes. Par exemple,
data test;
input id var1 var2 var3
datalines;
1 2 3 4
1 4 . 4
1 6 5 4
1 . 3 .
1 2 4 4
1 6 . 4
1 . 8 4
;
run;
Je veux que le résultat soit
1 2 3 4
1 4 . 4
1 6 5 4
1 2 4 4
1 . 8 4
La rangée 4 est supprimée car la rangée 1 a le même id, var2 et var3. La rangée 6 est supprimée parce que la rangée 3 a le même id, var1, var3. Je souhaite également une solution robuste, car je veux que la solution fonctionne pour n'importe quel nombre de variables dans l'ensemble de données (id serait toujours la clé unique).
Des idées ? Je pensais à sort nodupkey mais cela ne fonctionne pas s'il y a plus d'une valeur manquante dans une ligne.