267 votes

Sélection aléatoire de lignes dans un cadre de données Pandas

Existe-t-il un moyen de sélectionner des lignes aléatoires dans un DataFrame avec Pandas ?

En R, en utilisant le package car, il existe une fonction utile some(x, n) qui est similaire à head mais sélectionne, dans cet exemple, 10 lignes au hasard dans x.

J'ai également consulté la documentation sur le découpage en tranches et il semble qu'il n'y ait rien d'équivalent.

Mise à jour

J'utilise maintenant la version 20. Il y a un exemple de méthode.

df.sample(n)

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X