Sachez que np.array_split(df, 3)
divise le dataframe en 3 sous-dataframes, tandis que l'option split_dataframe
définie dans La réponse de @elixir lorsqu'il est appelé split_dataframe(df, chunk_size=3)
divise la trame de données tous les chunk_size
rangs.
Exemple :
Avec np.array_split
:
df = pd.DataFrame([1,2,3,4,5,6,7,8,9,10,11], columns=['TEST'])
df_split = np.array_split(df, 3)
...vous obtenez 3 sous-dataframes :
df_split[0] # 1, 2, 3, 4
df_split[1] # 5, 6, 7, 8
df_split[2] # 9, 10, 11
Avec split_dataframe
:
df_split2 = split_dataframe(df, chunk_size=3)
...vous obtenez 4 sous-dataframes :
df_split2[0] # 1, 2, 3
df_split2[1] # 4, 5, 6
df_split2[2] # 7, 8, 9
df_split2[3] # 10, 11
J'espère que j'ai raison et que cela vous sera utile.