J'ai des difficultés pour coder la variable route dans R de manière à ce qu'elle prenne une valeur unique lorsque la route est la même, indépendamment du point d'origine et de destination (L'origine est les 4 premiers caractères de la variable route et la destination est les 4 derniers). La base est la suivante :
base <- data.frame(route = c("SBAA - SBBE", "SBAA - SBBR", "SBAA - SBCI",
"SBBE - SBAA", "SBBE - SBBR", "SBBR - SBBE"),
seats = c(1231, 1021, 715, 989, 759, 695))
base <- as_tibble(base)
# A tibble: 6 x 2
route seats
<chr> <dbl>
1 SBAA - SBBE 1231
2 SBAA - SBBR 1021
3 SBAA - SBCI 715
4 SBBE - SBAA 989
5 SBBE - SBBR 759
6 SBBR - SBBE 695
J'ai pensé à faire une transformation pour générer le code variable :
code <-as.numeric (as.factor (route))
Cependant, le résultat sera différent pour les mêmes routes (mêmes aéroports de correspondance) mais avec des aéroports d'origine et de destination inversés. Par exemple, "SBAA - SBBE" et SBBE - SBAA " devraient avoir le même code, mais ressembleront à ceci :
route seats code
<chr> <dbl> <dbl>
1 SBAA - SBBE 1231 1
2 SBAA - SBBR 1021 2
3 SBAA - SBCI 715 3
4 SBBE - SBAA 989 4
5 SBBE - SBBR 759 5
6 SBBR - SBBE 695 6
J'ai besoin que les routes qui ont les mêmes aéroports de connexion aient le même code, de sorte que la variable de code renvoie le résultat suivant :
route seats code
<chr> <dbl> <dbl>
1 SBAA - SBBE 1231 1
2 SBAA - SBBR 1021 2
3 SBAA - SBCI 715 3
4 SBBE - SBAA 989 1
5 SBBE - SBBR 759 4
6 SBBR - SBBE 695 4
Notez que le code pour "SBAA - SBBE" est identique à "SBBE - SBAA". Merci pour votre aide.