Odpovídáte na názor k článku GCC 15 dostane AVX-512 optimalizace pro AMD Zen 4 a Zen 5. Názory mohou přidávat pouze registrovaní uživatelé. Nově přidané názory se na webu objeví až po schválení redakcí.
Zapíná optimalizaci vektorizace AVX2/SSE v rámci AVX-512
Věřím, že tomuto ani sám autor zprávičky nerozumí...
Podle mě jde spíš o dvojitý epilog v cyklech s tím, že se použijou 2 epilogy pro zbývající vektorové délky (XMM a YMM registry), když už se pro dané operace plně nevyužijou ZMM registry.
Ono je to ale celkem divné z toho hlediska, že AVX-512 má predikované load/store operace, takže toto většinou není potřeba (a Zen5 má 512-bit ALU, takže proč to dělat?). Pokud toto má vliv, tak to spíš vypadá na nějaké omezení v samotné mikroarchitektuře a nejedná se o optimalizaci, ale spíš o workaround.
Jinak jedná se o autovektorizaci, takže ve většině případů je to o ničem.
BTW: Chybí zdroj (Phoronix).
12. 11. 2024, 15:52 editováno autorem komentáře