Python : Pourquoi je ne peux pas comparer les index de deux dataframes dont l'un est un échantillon aléatoire ?

Question

Python : Pourquoi je ne peux pas comparer les index de deux dataframes dont l'un est un échantillon aléatoire ?

Demandé el 28 de Janvier, 2020: Quand la question a-t-elle été
55 affichage: Nombre de visites la question a
0 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'ai deux grands ensembles de données answer y truth et je veux prendre un échantillon aléatoire de answer et ensuite prendre l'échantillon de truth qui a les mêmes valeurs d'indice que l'échantillon answer mais cela ne fonctionne pas ! Voici ce que je fais :

answer = pd.read_csv("answer.csv")
a = answer.sample(700)

truth = pd.read_csv("truth.csv")
truth = truth[truth.index.isin(a.index)]

>>> print(a)
        item    question                   worker answer
9597    20308   clueweb09-enwp01-00-19667   w339    0
7371    20228   clueweb09-en0001-18-32106   w108    1
5527    20180   clueweb09-en0005-86-40955   w127    0
8505    20270   clueweb09-en0010-50-16267   w101    1
18202   20958   clueweb09-en0010-91-30990   w153    0
... ... ... ... ...
18004   20956   clueweb09-en0007-62-27063   w685    1
5532    20180   clueweb09-en0000-46-11807   w108    1
11510   20412   clueweb09-enwp00-91-09937   w353    1
6343    20202   clueweb09-en0003-34-25466   w102    0
16222   20780   clueweb09-en0011-26-41543   w683    0

>>> print(truth)
    item       question             truth
28  20002   clueweb09-en0009-15-02980   1
34  20002   clueweb09-en0010-92-14638   1
59  20002   clueweb09-en0011-89-08538   1
126 20012   clueweb09-en0007-39-22682   1
135 20012   clueweb09-en0007-24-18145   1
... ... ... ...
19610   20996   clueweb09-enwp00-98-10892   0
19626   20996   clueweb09-enwp00-97-10382   0
19663   20996   clueweb09-enwp01-53-09380   1
19676   20996   clueweb09-enwp01-63-12069   1
19688   20996   clueweb09-enwp01-69-11963   1

Quelqu'un sait-il pourquoi truth donne des valeurs d'index différentes ?

Demandé el 28 de Janvier, 2020 par joasa

Answer 1

0 Réponses

Python : Pourquoi je ne peux pas comparer les index de deux dataframes dont l'un est un échantillon aléatoire ?

Questions en vedette

Top Tags

Prograide.com

Powered by:

Python : Pourquoi je ne peux pas comparer les index de deux dataframes dont l'un est un échantillon aléatoire ?

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: