Tout d'abord, ni l'IEEE-754-2008 ni l'IEEE-1985 n'ont de flottants de 16 bits ; mais il s'agit d'une addition proposée avec un exposant de 5 bits et une fraction de 10 bits. IEEE-754 utilise un bit de signe dédié, donc la plage positive et négative est la même. De plus, la fraction a un 1 implicite devant, donc vous obtenez un bit supplémentaire.
Si vous voulez une précision à l'unité, c'est-à-dire que vous pouvez représenter chaque nombre entier, la réponse est assez simple : L'exposant décale le point décimal vers l'extrémité droite de la fraction. Ainsi, une fraction de 10 bits vous donne ±2 11 .
Si vous voulez un bit après le point décimal, vous renoncez à un bit avant, ce qui donne ±2. 10 .
La précision simple a une fraction de 23 bits, donc vous auriez ±2 24 entiers.
Le nombre de bits de précision dont vous avez besoin après le point décimal dépend entièrement des calculs que vous effectuez et de leur nombre.
- 2 10 \= 1,024
- 2 11 \= 2,048
- 2 23 \= 8,388,608
- 2 24 \= 16,777,216
- 2 53 \= 9.007.199.254.740.992 (double précision)
- 2 113 \= 10,384,593,717,069,655,257,060,992,658,440,192 (quad-precision)
Voir aussi
5 votes
@bendin : Oui, ça existe. fr.wikipedia.org/wiki/Half_precision_floating-point_format
0 votes
En rapport : La précision en virgule flottante est-elle mutable ou invariable ?
1 votes
@bendin even Un flotteur de 8 bits ou moins existe et est souvent enseigné dans les programmes d'informatique. Il est également utilisé dans Codage de l'ARM isntruction . Il existe également des flottants de 10, 11 et 14 bits.