Comparaison de tableaux numpy contenant des NaN

Question

Comparaison de tableaux numpy contenant des NaN

Demandé el 22 de Mai, 2012: Quand la question a-t-elle été
39326 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Pour mon unittest, je veux vérifier si deux tableaux sont identiques. Exemple réduit :

a = np.array([1, 2, np.NaN])
b = np.array([1, 2, np.NaN])

if np.all(a==b):
    print 'arrays are equal'

Cela ne fonctionne pas car nan != nan . Quelle est la meilleure façon de procéder ?

Demandé el 22 de Mai, 2012 par saroele

Answer 1

5 Réponses

Answer 2

52voto

senderle Points 41607

Pour les versions de numpy antérieures à la 1.19, c'est probablement la meilleure approche dans les situations qui n'impliquent pas spécifiquement des tests unitaires :

>>> ((a == b) | (numpy.isnan(a) & numpy.isnan(b))).all()
True

Cependant, les versions modernes fournissent le array_equal avec un nouvel argument mot-clé, equal_nan qui correspond exactement à la situation.

Ce point a été signalé pour la première fois par flyingdutchman ; voir sa réponse ci-dessous pour plus de détails.

Répondu el 22 de Mai, 2012 par senderle (41607 Points )

Answer 3

48voto

Avaris Points 11815

Vous pouvez également utiliser numpy.testing.assert_equal o numpy.testing.assert_array_equal avec un try/except :

In : import numpy as np

In : def nan_equal(a,b):
...:     try:
...:         np.testing.assert_equal(a,b)
...:     except AssertionError:
...:         return False
...:     return True

In : a=np.array([1, 2, np.NaN])

In : b=np.array([1, 2, np.NaN])

In : nan_equal(a,b)
Out: True

In : a=np.array([1, 2, np.NaN])

In : b=np.array([3, 2, np.NaN])

In : nan_equal(a,b)
Out: False

Editar

Puisque vous l'utilisez pour l'unittesting, il est inutile d'utiliser l'option assert (au lieu de l'envelopper pour obtenir True/False ) pourrait être plus naturel.

Répondu el 22 de Mai, 2012 par Avaris (11815 Points )

Answer 4

45voto

Luis Alberto Centeno Points 448

Le moyen le plus simple est d'utiliser numpy.allclose() qui permettent de spécifier le comportement en cas de valeurs nan. Votre exemple ressemblera alors à ce qui suit :

a = np.array([1, 2, np.nan])
b = np.array([1, 2, np.nan])

if np.allclose(a, b, equal_nan=True):
    print('arrays are equal')

Puis arrays are equal sera imprimé.

Vous pouvez trouver aquí la documentation correspondante

Répondu el 14 de Août, 2017 par Luis Alberto Centeno (448 Points )

Answer 5

12voto

flyingdutchman Points 546

La fonction numpy array_equal répond parfaitement aux exigences de la question avec le equal_nan ajouté dans la version 1.19. L'exemple serait le suivant :

a = np.array([1, 2, np.NaN])
b = np.array([1, 2, np.NaN])
assert np.array_equal(a, b, equal_nan=True)

Mais attention au fait que cela ne fonctionnera pas si un élément est de type dtype object . Je ne sais pas si c'est un bug ou pas.

Répondu el 9 de Décembre, 2020 par flyingdutchman (546 Points )

Answer 6

9voto

JoshAdel Points 15911

Vous pourriez utiliser des tableaux masqués numpy, masquer les NaN et ensuite utiliser numpy.ma.all o numpy.ma.allclose :

Par exemple :

a=np.array([1, 2, np.NaN])
b=np.array([1, 2, np.NaN])
np.ma.all(np.ma.masked_invalid(a) == np.ma.masked_invalid(b)) #True

Répondu el 22 de Mai, 2012 par JoshAdel (15911 Points )

Comparaison de tableaux numpy contenant des NaN

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comparaison de tableaux numpy contenant des NaN

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: