Nevim kde beres pocit ze to neodpovida zrychleni - proste v beznem kodu je X procent memcpy, a ted je tento kod 2 krat rychlejsi, takze celkovy prinos je X/2 procent vykonu navic.
Zadna distribuce neresi subvarianty ani emulace / nahrazky.
Vzdy je to skompilovany optimalne, vuci urcite urovni architektury. Tj bezne ubuntu bezi na nejakem minimalnim hw, a ta nova rekompilace pod nazvem x86-64-v3 ti vyzaduje hw s AVX2. Ani jedna z techto distribuci neresi runtime detekci.
A dalsi zminena nevyhoda AVX2 je dvakrat vetsi kontext, ktery se musi ukladat pri task switchu (otazka je, zda vzdy, nebo jen kdyz userspace pouzije tyhle instrukce).