Odpověď na názor

Odpovídáte na názor k článku GCC 15 dostane AVX-512 optimalizace pro AMD Zen 4 a Zen 5. Názory mohou přidávat pouze registrovaní uživatelé. Nově přidané názory se na webu objeví až po schválení redakcí.

  • 12. 11. 2024 15:48

    cc

    Zapíná optimalizaci vektorizace AVX2/SSE v rámci AVX-512

    Věřím, že tomuto ani sám autor zprávičky nerozumí...

    Podle mě jde spíš o dvojitý epilog v cyklech s tím, že se použijou 2 epilogy pro zbývající vektorové délky (XMM a YMM registry), když už se pro dané operace plně nevyužijou ZMM registry.

    Ono je to ale celkem divné z toho hlediska, že AVX-512 má predikované load/store operace, takže toto většinou není potřeba (a Zen5 má 512-bit ALU, takže proč to dělat?). Pokud toto má vliv, tak to spíš vypadá na nějaké omezení v samotné mikroarchitektuře a nejedná se o optimalizaci, ale spíš o workaround.

    Jinak jedná se o autovektorizaci, takže ve většině případů je to o ničem.

    BTW: Chybí zdroj (Phoronix).

    12. 11. 2024, 15:52 editováno autorem komentáře