120 votes

Python - Dimension du cadre de données

Nouveau dans Python.

En R, vous pouvez obtenir la dimension d'une matrice en utilisant dim(...). Quelle est la fonction correspondante dans Pandas Python pour leur cadre de données ?

186voto

BrenBarn Points 63718

df.shape donde df est votre DataFrame.

44voto

Ted Petrou Points 20559

Résumé de toutes les façons d'obtenir des informations sur les dimensions d'un DataFrame ou d'une série.

Il existe plusieurs façons d'obtenir des informations sur les attributs de votre DataFrame ou de votre série.

Créer un échantillon de DataFrame et de séries

df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df

     a  b
0  5.0  9
1  2.0  2
2  NaN  4

s = df['a']
s

0    5.0
1    2.0
2    NaN
Name: a, dtype: float64

shape Attribut

Le site shape renvoie un tuple de deux éléments, à savoir le nombre de lignes et le nombre de colonnes du DataFrame. Pour une série, il renvoie un tuple à un élément.

df.shape
(3, 2)

s.shape
(3,)

len fonction

Pour obtenir le nombre de lignes d'un DataFrame ou la longueur d'une série, utilisez la fonction len fonction. Un nombre entier sera renvoyé.

len(df)
3

len(s)
3

size attribut

Pour obtenir le nombre total d'éléments dans le DataFrame ou la série, utilisez la fonction size attribut. Pour les DataFrames, il s'agit du produit du nombre de lignes et du nombre de colonnes. Pour une série, cela équivaut à l'attribut len fonction :

df.size
6

s.size
3

ndim attribut

Le site ndim renvoie le nombre de dimensions de votre DataFrame ou série. Il sera toujours de 2 pour les DataFrames et de 1 pour les Series :

df.ndim
2

s.ndim
1

L'épineux count méthode

Le site count peut être utilisée pour renvoyer le nombre de valeurs non manquantes pour chaque colonne/ligne du DataFrame. Cela peut être très déroutant, car la plupart des gens pensent normalement que le nombre est simplement la longueur de chaque ligne, ce qui n'est pas le cas. Lorsqu'elle est appelée sur un DataFrame, une série est renvoyée avec les noms des colonnes dans l'index et le nombre de valeurs non manquantes dans les valeurs.

df.count() # by default, get the count of each column

a    2
b    3
dtype: int64

df.count(axis='columns') # change direction to get count of each row

0    2
1    2
2    1
dtype: int64

Dans le cas d'une série, il n'y a qu'un seul axe pour le calcul et il ne retourne donc qu'un scalaire :

s.count()
2

Utilisez le info méthode de récupération de métadonnées

Le site info La méthode renvoie le nombre de valeurs non manquantes et les types de données de chaque colonne.

df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a    2 non-null float64
b    3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X