J'ai un tableau numpy de forme (20000, 600, 768). J'ai besoin de le stocker, afin de pouvoir le recharger plus tard dans mon code. Le principal problème est l'utilisation de la mémoire lorsque vous le chargez à nouveau. Je n'ai que 16 Go de RAM.
Par exemple, j'ai essayé le cornichon. Quand il charge tout, il ne me reste presque plus de mémoire pour faire autre chose. Surtout pour entraîner le modèle.
J'ai essayé d'écrire et de recharger avec hdf5 (h5py). Juste un petit morceau (1000, 600, 768). Mais il semble que cela "mange" encore plus de mémoire.
J'ai aussi essayé le csv C'est tout simplement un non-non. Cela prend TROP de temps pour écrire les données.
Je serais reconnaissant pour toute suggestion sur la façon dont je pourrais stocker mon tableau de sorte que lorsque je le chargerais à nouveau, il ne prendrait pas autant de mémoire.
P.S. Les données que je stocke sont des représentations vectorielles de textes que j'utilise ensuite pour l'entraînement de mon modèle.