J'aimerais mesurer le temps que chaque thread passe à faire un morceau de code. J'aimerais voir si ma stratégie d'équilibrage de charge répartit équitablement les morceaux entre les travailleurs. Typiquement, mon code ressemble à ce qui suit :
#pragma omp parallel for schedule(dynamic,chunk) private(i)
for(i=0;i<n;i++){
//loop code here
}
UPDATE J'utilise openmp 3.1 avec gcc.