Je fais de la régression logistique sur des données d'iris provenant de Sklearn, je connais les mathématiques et j'essaie de les mettre en œuvre. A l'étape finale, j'obtiens un vecteur de prédiction, ce vecteur de prédiction représente la probabilité que ce point de données soit dans la classe 1 ou la classe 2 (classification binaire).
Maintenant je veux transformer ce vecteur de prédiction en vecteur cible. Disons que si la probabilité est supérieure à 50%, le point de données correspondant appartiendra à la classe 1, sinon à la classe 2. Utiliser 0 pour représenter la classe 1, 1 pour la classe 2.
Je sais qu'il y a une version en boucle de ce système, qui passe en revue tout le vecteur. Mais quand la taille devient grande, la boucle for est très coûteuse, donc je veux le faire plus efficacement, comme l'opération matricielle de numpy, qui est plus rapide que de faire l'opération matricielle dans la boucle for.
Une suggestion sur la méthode la plus rapide ?