Je suis intéressé à savoir comment convertir une pandas dataframe dans un tableau numpy, y compris l'index, et de définir la dtypes.
dataframe:
label A B C
ID
1 NaN 0.2 NaN
2 NaN NaN 0.5
3 NaN 0.2 0.5
4 0.1 0.2 NaN
5 0.1 0.2 0.5
6 0.1 NaN 0.5
7 0.1 NaN NaN
convertir df de tableau renvoie:
array([[ nan, 0.2, nan],
[ nan, nan, 0.5],
[ nan, 0.2, 0.5],
[ 0.1, 0.2, nan],
[ 0.1, 0.2, 0.5],
[ 0.1, nan, 0.5],
[ 0.1, nan, nan]])
Cependant, je voudrais:
array([[ 1, nan, 0.2, nan],
[ 2, nan, nan, 0.5],
[ 3, nan, 0.2, 0.5],
[ 4, 0.1, 0.2, nan],
[ 5, 0.1, 0.2, 0.5],
[ 6, 0.1, nan, 0.5],
[ 7, 0.1, nan, nan]],
dtype=[('ID', '<i4'), ('A', '<f8'), ('B', '<f8'), ('B', '<f8')])
(ou similaire)
Toutes les suggestions sur la façon d'accomplir ceci? (Je ne sais pas si j'ai besoin 1D ou 2D tableau à ce point.) J'ai vu quelques posts sur ce, mais rien qui traitent spécifiquement de la dataframe.index.
Je suis en train d'écrire le dataframe disque à l'aide de to_csv (et de le lire à créer la matrice) comme une solution de contournement, mais préférez quelque chose de plus éloquent que mes nouveaux pandas kludging.