S'agit-il d'un bogue dans l'optimiseur de gcc ?

Question

S'agit-il d'un bogue dans l'optimiseur de gcc ?

Demandé el 18 de Avril, 2016: Quand la question a-t-elle été
315 affichage: Nombre de visites la question a
1 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Lorsque je compile le code suivant avec gcc 6 -O3 -std=c++14 je suis bien et vide main :

Dump of assembler code for function main():
   0x00000000004003e0 <+0>:     xor    %eax,%eax
   0x00000000004003e2 <+2>:     retq

Mais le fait de décommenter la dernière ligne dans le fichier principal "casse" l'optimisation :

Dump of assembler code for function main():
   0x00000000004005f0 <+0>:     sub    $0x78,%rsp
   0x00000000004005f4 <+4>:     lea    0x40(%rsp),%rdi
   0x00000000004005f9 <+9>:     movq   $0x400838,0x10(%rsp)
   0x0000000000400602 <+18>:    movb   $0x0,0x18(%rsp)
   0x0000000000400607 <+23>:    mov    %fs:0x28,%rax
   0x0000000000400610 <+32>:    mov    %rax,0x68(%rsp)
   0x0000000000400615 <+37>:    xor    %eax,%eax
   0x0000000000400617 <+39>:    movl   $0x0,(%rsp)
   0x000000000040061e <+46>:    movq   $0x400838,0x30(%rsp)
   0x0000000000400627 <+55>:    movb   $0x0,0x38(%rsp)
   0x000000000040062c <+60>:    movl   $0x0,0x20(%rsp)
   0x0000000000400634 <+68>:    movq   $0x400838,0x50(%rsp)
   0x000000000040063d <+77>:    movb   $0x0,0x58(%rsp)
   0x0000000000400642 <+82>:    movl   $0x0,0x40(%rsp)
   0x000000000040064a <+90>:    callq  0x400790 <ErasedObject::~ErasedObject()>
   0x000000000040064f <+95>:    lea    0x20(%rsp),%rdi
   0x0000000000400654 <+100>:   callq  0x400790 <ErasedObject::~ErasedObject()>
   0x0000000000400659 <+105>:   mov    %rsp,%rdi
   0x000000000040065c <+108>:   callq  0x400790 <ErasedObject::~ErasedObject()>
   0x0000000000400661 <+113>:   mov    0x68(%rsp),%rdx
   0x0000000000400666 <+118>:   xor    %fs:0x28,%rdx
   0x000000000040066f <+127>:   jne    0x400678 <main()+136>
   0x0000000000400671 <+129>:   xor    %eax,%eax
   0x0000000000400673 <+131>:   add    $0x78,%rsp
   0x0000000000400677 <+135>:   retq   
   0x0000000000400678 <+136>:   callq  0x4005c0 <__stack_chk_fail@plt>

Código

#include <type_traits>
#include <new>

namespace
{
struct ErasedTypeVTable
{
   using destructor_t = void (*)(void *obj);

   destructor_t dtor;
};

template <typename T>
void dtor(void *obj)
{
   return static_cast<T *>(obj)->~T();
}

template <typename T>
static const ErasedTypeVTable erasedTypeVTable = {
   &dtor<T>
};
}

struct ErasedObject
{
   std::aligned_storage<sizeof(void *)>::type storage;
   const ErasedTypeVTable& vtbl;
   bool flag = false;

   template <typename T, typename S = typename std::decay<T>::type>
   ErasedObject(T&& obj)
   : vtbl(erasedTypeVTable<S>)
   {
      static_assert(sizeof(T) <= sizeof(storage) && alignof(T) <= alignof(decltype(storage)), "");
      new (object()) S(std::forward<T>(obj));
   }

   ErasedObject(ErasedObject&& other) = default;

   ~ErasedObject()
   {
      if (flag)
      {
         ::operator delete(object());
      }
      else
      {
         vtbl.dtor(object());
      }
   }

   void *object()
   {
      return reinterpret_cast<char *>(&storage);
   }
};

struct myType
{
   int a;
};

int main()
{
   ErasedObject c1(myType{});
   ErasedObject c2(myType{});
   //ErasedObject c3(myType{});
}

clang peut optimiser les deux versions.

Une idée de ce qui se passe ? Est-ce que je me heurte à une limite d'optimisation ? Si oui, est-elle configurable ?

Demandé el 18 de Avril, 2016 par Maciej Cencora

Answer 1

1 Réponses

Answer 2

5voto

Rafał Rawicki Points 10069

J'ai couru g++ con -fdump-ipa-inline pour obtenir plus d'informations sur les raisons pour lesquelles les fonctions sont ou ne sont pas inlined.

Pour le testcase avec la fonction main() et trois objets créés, j'ai obtenu :

  (...)
  150 Deciding on inlining of small functions.  Starting with size 35.
  151 Enqueueing calls in void {anonymous}::dtor(void*) [with T = myType]/40.
  152 Enqueueing calls in int main()/35.
  153   not inlinable: int main()/35 -> ErasedObject::~ErasedObject()/33, call is unlikely and code size would grow
  154   not inlinable: int main()/35 -> ErasedObject::~ErasedObject()/33, call is unlikely and code size would grow
  155   not inlinable: int main()/35 -> ErasedObject::~ErasedObject()/33, call is unlikely and code size would grow
  (...)

Ce code d'erreur est défini dans gcc/gcc/ipa-inline.c :

  else if (!e->maybe_hot_p ()
       && (growth >= MAX_INLINE_INSNS_SINGLE
       || growth_likely_positive (callee, growth)))
{
      e->inline_failed = CIF_UNLIKELY_CALL;
      want_inline = false;
}

J'ai alors découvert que le plus petit changement pour que g++ intègre ces fonctions est d'ajouter une déclaration :

int main() __attribute__((hot));

Je n'ai pas été capable de trouver dans le code pourquoi int main() n'est pas considéré comme chaud, mais cela devrait probablement être laissé pour une autre question.

La deuxième partie du conditionnel que j'ai collé ci-dessus est plus intéressante. L'intention était de ne pas inliner lorsque le code va croître et vous avez produit un exemple où le code se réduit après l'inlining complet.

Je pense que cela mérite d'être signalé Le bugzilla de GCC L'estimation de l'impact inline est une heuristique et, en tant que telle, elle est censée fonctionner correctement dans la plupart des cas, pas dans tous.

Répondu el 19 de Avril, 2016 par Rafał Rawicki (10069 Points )

S'agit-il d'un bogue dans l'optimiseur de gcc ?

Réponse

Questions en vedette

Top Tags

Prograide.com

Powered by:

S'agit-il d'un bogue dans l'optimiseur de gcc ?

Réponse

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: