Nouveau dans Python.
En R, vous pouvez obtenir la dimension d'une matrice en utilisant dim(...). Quelle est la fonction correspondante dans Pandas Python pour leur cadre de données ?
Nouveau dans Python.
En R, vous pouvez obtenir la dimension d'une matrice en utilisant dim(...). Quelle est la fonction correspondante dans Pandas Python pour leur cadre de données ?
Il existe plusieurs façons d'obtenir des informations sur les attributs de votre DataFrame ou de votre série.
Créer un échantillon de DataFrame et de séries
df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df
a b
0 5.0 9
1 2.0 2
2 NaN 4
s = df['a']
s
0 5.0
1 2.0
2 NaN
Name: a, dtype: float64
shape
AttributLe site shape
renvoie un tuple de deux éléments, à savoir le nombre de lignes et le nombre de colonnes du DataFrame. Pour une série, il renvoie un tuple à un élément.
df.shape
(3, 2)
s.shape
(3,)
len
fonctionPour obtenir le nombre de lignes d'un DataFrame ou la longueur d'une série, utilisez la fonction len
fonction. Un nombre entier sera renvoyé.
len(df)
3
len(s)
3
size
attributPour obtenir le nombre total d'éléments dans le DataFrame ou la série, utilisez la fonction size
attribut. Pour les DataFrames, il s'agit du produit du nombre de lignes et du nombre de colonnes. Pour une série, cela équivaut à l'attribut len
fonction :
df.size
6
s.size
3
ndim
attributLe site ndim
renvoie le nombre de dimensions de votre DataFrame ou série. Il sera toujours de 2 pour les DataFrames et de 1 pour les Series :
df.ndim
2
s.ndim
1
count
méthodeLe site count
peut être utilisée pour renvoyer le nombre de valeurs non manquantes pour chaque colonne/ligne du DataFrame. Cela peut être très déroutant, car la plupart des gens pensent normalement que le nombre est simplement la longueur de chaque ligne, ce qui n'est pas le cas. Lorsqu'elle est appelée sur un DataFrame, une série est renvoyée avec les noms des colonnes dans l'index et le nombre de valeurs non manquantes dans les valeurs.
df.count() # by default, get the count of each column
a 2
b 3
dtype: int64
df.count(axis='columns') # change direction to get count of each row
0 2
1 2
2 1
dtype: int64
Dans le cas d'une série, il n'y a qu'un seul axe pour le calcul et il ne retourne donc qu'un scalaire :
s.count()
2
info
méthode de récupération de métadonnéesLe site info
La méthode renvoie le nombre de valeurs non manquantes et les types de données de chaque colonne.
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a 2 non-null float64
b 3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes
Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.