J'essaie de charger l'ensemble de données MNIST lié aquí en Python 3.2 à l'aide de ce programme :
import pickle
import gzip
import numpy
with gzip.open('mnist.pkl.gz', 'rb') as f:
l = list(pickle.load(f))
print(l)
Malheureusement, j'obtiens l'erreur suivante :
Traceback (most recent call last):
File "mnist.py", line 7, in <module>
train_set, valid_set, test_set = pickle.load(f)
UnicodeDecodeError: 'ascii' codec can't decode byte 0x90 in position 614: ordinal not in range(128)
J'ai ensuite essayé de décoder le fichier décapé en Python 2.7, et de le recoder. J'ai donc exécuté ce programme en Python 2.7 :
import pickle
import gzip
import numpy
with gzip.open('mnist.pkl.gz', 'rb') as f:
train_set, valid_set, test_set = pickle.load(f)
# Printing out the three objects reveals that they are
# all pairs containing numpy arrays.
with gzip.open('mnistx.pkl.gz', 'wb') as g:
pickle.dump(
(train_set, valid_set, test_set),
g,
protocol=2) # I also tried protocol 0.
Il s'est exécuté sans erreur, j'ai donc réexécuté ce programme en Python 3.2 :
import pickle
import gzip
import numpy
# note the filename change
with gzip.open('mnistx.pkl.gz', 'rb') as f:
l = list(pickle.load(f))
print(l)
Cependant, j'ai obtenu la même erreur qu'auparavant. Comment faire pour que cela fonctionne ?
Il s'agit d'une meilleure approche pour le chargement de l'ensemble de données MNIST.