Supposons que j'ai un dictionnaire imbriqué 'user_dict' avec une structure :
- Niveau 1 : UserId (Long Integer)
- Niveau 2 : Catégorie (Chaîne)
- Niveau 3 : Attributs assortis (flottants, ints, etc.)
Par exemple, une entrée de ce dictionnaire serait :
user_dict[12] = {
"Category 1": {"att_1": 1,
"att_2": "whatever"},
"Category 2": {"att_1": 23,
"att_2": "another"}}
chaque élément dans user_dict
a la même structure et user_dict
contient un grand nombre d'éléments que je veux introduire dans un DataFrame pandas, en construisant la série à partir des attributs. Dans ce cas, un index hiérarchique serait utile.
Plus précisément, ma question est de savoir s'il existe un moyen d'aider le constructeur de DataFrame à comprendre que la série doit être construite à partir des valeurs du "niveau 3" du dictionnaire ?
Si j'essaie quelque chose comme :
df = pandas.DataFrame(users_summary)
Les éléments du "niveau 1" (les UserId) sont considérés comme des colonnes, ce qui est l'inverse de ce que je veux obtenir (avoir les UserId comme index).
Je sais que je pourrais construire la série après avoir itéré sur les entrées du dictionnaire, mais s'il existe un moyen plus direct, ce serait très utile. Une question similaire serait de savoir s'il est possible de construire un DataFrame pandas à partir d'objets json listés dans un fichier.