4 votes

Comment utiliser R pour calculer le score de Tanimoto/Jacquard en tant que matrice de distance ?

J'aimerais calculer la matrice de distance des lignes d'un tableau dans R en utilisant le score de Tanimoto/Jacquard comme matrice de distance.

Est-ce possible ? Si oui, pourriez-vous m'apprendre à le faire ?

10voto

Roman Luštrik Points 19295

vegan dispose d'un vegdist qui permet de calculer, entre autres, l'indice de Jaccard. En supposant que c'est ce que vous recherchez. Son utilisation est assez simple.

library(vegan)
data(varespec)
vare.dist <- vegdist(varespec, method = "jaccard")

Les autres méthodes disponibles sont les suivantes

method   Dissimilarity index, partial match to "manhattan", "euclidean",
 "canberra", "bray", "kulczynski", "jaccard", "gower", "altGower", "morisita",
 "horn", "mountford", "raup" , "binomial" or "chao"

7voto

Ben Bolker Points 50041

Je pense que vous aurez plus de chance en cherchant "Jaccard" plutôt que "Jacquard".

  • Installer le paquetage 'sos' ( install.packages("sos") )
  • Rechercher les fonctions contenant ces chaînes de caractères ( library(sos); findFn("tanimoto jaccard") ).
  • Cherchez dans les résultats quelque chose de convenable (il me semble qu'il s'agit de cette est probablement votre meilleure option ; install.packages("ade4"); library("ade4"); ?dist.binary )
  • Si vous ne savez pas comment l'utiliser, modifiez votre question en donnant un petit exemple reproductible de ce que vous voulez faire.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X