L'ADN n'est pas stocké en un seul flux, mais la plupart du temps par chromosomes.
Un grand chromosome prend environ 300 Mo et un petit environ 50 Mo.
Je pense que la première raison pour laquelle les données ne sont pas sauvegardées en 2 bits par paire de base est qu'il serait difficile de travailler avec les données. La plupart des gens ne sauraient pas comment les convertir. Et même lorsqu'un programme de conversion est fourni, beaucoup de personnes dans les grandes entreprises ou les instituts de recherche ne sont pas autorisées à demander ou ne savent pas comment installer des programmes...
1GB de stockage ne coûte rien, même le téléchargement de 3 GB ne prend que 4 minutes avec 100 Mbitsps et la plupart des entreprises ont des vitesses plus élevées.
Par ailleurs, les données ne sont pas aussi simples qu'on le dit.
Par exemple, la méthode de séquençage inventée par Craig_Venter a été une grande avancée, mais elle a aussi ses inconvénients. Elle ne pouvait pas séparer les longues chaînes de la même paire de bases, de sorte qu'il n'est pas toujours possible de savoir à 100 % s'il y a 8 A ou 9 A. Ce sont des choses dont il faut s'occuper plus tard...
Un autre exemple est le Méthylation de l'ADN parce qu'il est impossible de stocker cette information dans une représentation de 2 bits.