Comment puis-je créer un DataFrame à partir de plusieurs numpy
tableaux, Pandas
de la Série, ou Pandas
DataFrame du tout en préservant l'ordre des colonnes?
Par exemple, j'ai ces deux - numpy
tableaux et je tiens à les mélanger entre eux un Pandas
DataFrame.
foo = np.array( [ 1, 2, 3 ] )
bar = np.array( [ 4, 5, 6 ] )
Si je fais cela, l' bar
colonne d'abord parce qu' dict
ne pas maintenir l'ordre.
pd.DataFrame( { 'foo': pd.Series(foo), 'bar': pd.Series(bar) } )
bar foo
0 4 1
1 5 2
2 6 3
Je peux le faire, mais c'est pénible quand j'ai besoin de combiner un grand nombre de variables.
pd.DataFrame( { 'foo': pd.Series(foo), 'bar': pd.Series(bar) }, columns = [ 'foo', 'bar' ] )
EDIT: Est-il un moyen de spécifier les variables à ajouter et d'organiser l'ordre des colonnes en une seule opération? C'est, je n'ai pas l'esprit à l'aide de plusieurs lignes pour compléter l'ensemble de l'opération, mais je préfère ne pas avoir à préciser les variables qui doivent être joints à plusieurs reprises (car je vais changer le code beaucoup et c'est à peu enclins à faire des erreurs).
EDIT2: Un point de plus. Si je veux en ajouter ou en supprimer des variables à être rejoint, je veux seulement ajouter/supprimer en un seul endroit.