Je suis novice dans des réseaux de neurones à convolution et juste avoir une idée sur la fonctionnalité des cartes et comment convolution est fait sur les images pour extraire des caractéristiques. Je serais heureux de connaître certains détails sur l'application de la normalisation de lots à CNN.
J'ai lu ce livre https://arxiv.org/pdf/1502.03167v3.pdf et pourrait comprendre la BN application d'un algorithme sur des données, mais à la fin, ils ont mentionné qu'une légère modification n'est requise lorsqu'il est appliqué à CNN:
Pour convolutifs couches, en outre, nous voulons la normalisation d'obéir à la convolution de la propriété, de sorte que les différents éléments de la même fonction de la carte, à différents endroits, sont normalisées de la même manière. Pour atteindre cet objectif, nous avons conjointement normaliser tous les activations dans un mini - lot, dans tous les sites. En Alg. 1, nous soit B l'ensemble de toutes les valeurs d'une fonction de carte à travers à la fois les éléments d'un mini-lot et localisations spatiales – donc, pour un mini-lot de taille m et de la fonctionnalité des cartes de taille p × q, nous utilisons l'efficacité de mini-lot de taille m' = |B| = m · pq. Nous apprenons une paire de paramètres γ(k) et β(k) par la carte, plutôt que par l'activation. Alg. 2 est modifié de la même, de sorte que lors de l'inférence de la BN de transformation s'applique de la même transformation linéaire à chaque activation d'une fonctionnalité donnée de la carte.
Je suis total confus quand ils disent "de sorte que les différents éléments de la même fonction de la carte, à différents endroits, sont normalisées de la même manière"
Je sais quelle est la caractéristique des cartes de la moyenne et de différents éléments sont les poids de toutes les fonctionnalités de la carte. Mais je ne pouvais pas comprendre ce que l'emplacement ou la localisation spatiale des moyens.
Je ne pouvais pas comprendre la phrase ci-dessous, à tous les "En Alg. 1, nous soit B l'ensemble de toutes les valeurs d'une fonction de carte à travers à la fois les éléments d'un mini-lot et localisations spatiales"
Je serais heureux si quelqu'un froid élaborer et de m'expliquer dans des termes beaucoup plus simple