J'essaie de charger un très gros fichier JSON en Python. J'ai essayé :
import json
data = open('file.json').read()
loaded = json.loads(data)
mais cela me donne une erreur SIGKILL.
J'ai essayé :
import pandas as pd
df = pd.read_json('file.json')
et j'obtiens une erreur de mémoire insuffisante.
J'aimerais essayer d'utiliser ijson
pour diffuser mes données et n'en extraire qu'un sous-ensemble à la fois. Cependant, vous devez connaître le schéma du fichier JSON afin de savoir quels événements rechercher. Je ne sais pas vraiment quel est le schéma de mon fichier JSON. J'ai donc deux questions :
-
Existe-t-il un moyen de charger ou de diffuser un gros fichier json en Python sans connaître le schéma ? Ou un moyen de convertir un fichier JSON dans un autre format (ou dans un serveur postgresql, par exemple) ?
-
Existe-t-il un outil permettant d'extraire le schéma de mon fichier JSON ?
UPDATE :
Utilisé head file.json
pour avoir une idée de ce à quoi ressemble mon fichier JSON. À partir de là, c'est un peu plus facile.