Avx je naopak naprosto nezajimavy argument, protoze vyuziti je tak specificke a tak uzke, ze nedava zadny smysl. Na drtivou vetsinu uloh kde by to vubec smysl davalo je totiz radove vyhodnejsi pouzit GPU.
A na tom se nic nezmeni. Naopak. Jak bude dochazet k obmenovani GPU, tak bude rust pocet lidi kterym AVX nic neda.
Falesny argument, GPU je radove energeticky efektivnejsi per jednotka vykonu.
A pokud dobre vidim, tak oni se chlubi tim, ze tu appku maji navrzenou prave pro avx, a tudiz nikoli pro gpu, kdyby ji predelali pro gpu byla by o rad vykonejsi.
Ja ovsem nezpochybnuju to ze muze existovat nejaky velice uzky okruh uloh, ktere budou tak specificke, ze pro je avx bude vyhodnejsi. Ale jak sem rek, takovych bude naprosta minorita.
A pokud budu resit sw pro nejaky distribuovany vypocet, tak GPU ma radove vice lidi, nez cpu s avx.
Nevím co tím chceš říct, nicméně jestliže buď neumíš kontaktovat Karlovu univerzitu s návrhem na zlepšením kódu pro GPU anebo alespoň přispět výpočetním výkonem v CPU výpočtech, tak se řadíš do zástupu tlachajících ubožáků, sorry.
Už sdílím výkon CPU/GPU 20 let pro BOINC a tak jsem zanechal nesmazatelnou stopu ve srovnání s kecálkama. Takže co si budeme povídat.
AVX512 je v procesorech už 8 let, ale možných kombinací co který CPU podporoval/nepodporoval bylo spousta, tak není divu že to zatím skoro nikdo nepoužíval. Viz např. článek zde na rootu.
Ve skutečnosti přináší AVX-512 tak rozsáhlou změnu, že je rozděleno do několika podmnožin, přičemž zdaleka na všechny mikroprocesory musí podporovat všechny podmnožiny. To má zajímavý důsledek – počet možných kombinací podporuje/nepodporuje je obrovský.
https://www.root.cz/clanky/rozsireni-instrukcni-sady-f16c-fma-a-avx-512-na-platforme-x86-64/#k16
Ok, v takovém případě upravuji svůj odhad z osmi na dvanáct let: 6 let než si to sedne do nějaké koncenzuální úrovně aby nebylo třeba dělat v kódu hromady výhybek, 4 roky než market share takových procesorů dosáhne úrovně aby to developeři začali brát vážně, 2 roky, než se to dostane do reálného softu. No a samozřejmě Debian upraví defaultní -march aby gcc ty instrukce směl použít za dalších 10 let ;-)
Ty kombinace jsou ale v reálu jen 2 - Skylake a Icelake/Zen4/Zen5.
AVX-512 je sice fragmentované (hodně CPUID bitů pro různé specifické rozšíření), ale procesory víceméně implementujou to stejné, takže jako první se dá označit AVX-512 v Skylake, které bylo celkem omezené, a pak průnik IceLake a Zen4.
Ty novější rozšíření jsou navíc hodně specifické a některé přináší jen pár instrukcí, které ne každý dokáže využít, takže obecný AVX-512 kód je prostě takový baseline použitelný na většinu věcí.