106 votes

Quelle quantité de mémoire serait nécessaire pour stocker le génome humain ?

Je cherche la quantité de stockage en octets (MB, GB, TB, etc.) nécessaire pour stocker un seul génome humain. J'ai lu quelques articles sur Wikipedia à propos de l'ADN, des chromosomes, des paires de bases, des gènes, et j'ai une idée approximative, mais avant de divulguer quoi que ce soit, j'aimerais voir comment d'autres personnes aborderaient cette question.

Une autre question serait de savoir combien d'atomes il y a dans l'ADN humain, mais ce serait hors sujet pour ce site.

Je comprends qu'il s'agit d'une approximation, je cherche donc la valeur minimale qui permettrait de stocker l'ADN de n'importe quel être humain.

85voto

Oli Charlesworth Points 148744

Si vous vous fiez à ce genre de choses, voici ce qu'affirme Wikipédia (à partir de http://en.wikipedia.org/wiki/Human_genome#Information_content ) :

Les 2,9 milliards de paires de bases du génome humain haploïde correspondent à un maximum d'environ 725 mégaoctets. maximum d'environ 725 mégaoctets de données, puisque chaque paire de base peut être peut être codée par 2 bits. Étant donné que les génomes individuels varient de moins de 1 % les uns par rapport aux autres, le nombre de paires de bases peut être réduit. les uns des autres, ils peuvent être compressés sans perte à environ 4 mégaoctets.

29voto

rauschen Points 1880

L'ADN n'est pas stocké en un seul flux, mais la plupart du temps par chromosomes.

Un grand chromosome prend environ 300 Mo et un petit environ 50 Mo.


Je pense que la première raison pour laquelle les données ne sont pas sauvegardées en 2 bits par paire de base est qu'il serait difficile de travailler avec les données. La plupart des gens ne sauraient pas comment les convertir. Et même lorsqu'un programme de conversion est fourni, beaucoup de personnes dans les grandes entreprises ou les instituts de recherche ne sont pas autorisées à demander ou ne savent pas comment installer des programmes...

1GB de stockage ne coûte rien, même le téléchargement de 3 GB ne prend que 4 minutes avec 100 Mbitsps et la plupart des entreprises ont des vitesses plus élevées.

Par ailleurs, les données ne sont pas aussi simples qu'on le dit.

Par exemple, la méthode de séquençage inventée par Craig_Venter a été une grande avancée, mais elle a aussi ses inconvénients. Elle ne pouvait pas séparer les longues chaînes de la même paire de bases, de sorte qu'il n'est pas toujours possible de savoir à 100 % s'il y a 8 A ou 9 A. Ce sont des choses dont il faut s'occuper plus tard...

Un autre exemple est le Méthylation de l'ADN parce qu'il est impossible de stocker cette information dans une représentation de 2 bits.

15voto

Paul Armstrong Points 5117

En principe, chaque paire de bases prend 2 bits (vous pouvez utiliser 00, 01, 10, 11 pour T, G, C et A). Comme il y a environ 2,9 milliards de paires de bases dans le génome humain, (2 * 2,9 milliards) bits ~= 691 mégaoctets.

Je ne suis pas un expert, mais les Génome humain sur Wikipédia indique ce qui suit :

MB brut :

  • Homme (XY) : 770MB
  • Femme (XX) : 756MB

Je ne sais pas exactement d'où vient leur variance, mais je suis sûr que vous pouvez vous en rendre compte.

11voto

Oui, l'espace de stockage minimum nécessaire pour l'ADN humain entier est d'environ 770 Mo.

Cependant, la représentation sur 2 bits n'est pas pratique. Il est difficile d'y effectuer des recherches ou des calculs. C'est pourquoi certains mathématiciens ont conçu des moyens plus efficaces de stocker ces séquences de bases et de les utiliser dans des algorithmes de recherche et de comparaison. L'un de ces exemples est GARLI .

Cette application fonctionne actuellement sur mon PC, et le génome humain est stocké dans mon ordinateur. 1563 MB .

6voto

slayton Points 13049

Le génome humain contient plus de 3 milliards de paires de bases. Si l'on représente chaque paire de bases par deux bits, il faut alors plus de 6,15 × 10⁹ bits, soit environ 770 Mo.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X