moc pekny clanek. dotaz na autora, pouzivate tohle ve sve praci na svoje vypocty?
pamatuji kdysi davno kolem 2004 jsem kolegum skladal cluster s mpi pro vypocty molekularni dynamiky a monte carlo. tehdy to byly kompy se dvema sloty cpu a koupili si i intelacky kompiler, takze jsem knihovny prekompiloval s nim. byli spokojeni, ze jsou vypocty o dost rychlejsi nez s gcc.
Ano, MPI v práci používáme. Třeba v molekulární dynamice LAMMPS. Teď jsem to zkoušel kompilovat Intel kompilátorem (je zdarma, nějakou dobu se ale myslím opravdu musel platit). Tak je to o trochu rychlejší, mají tam avx512 instrukce, které gcc z nějakého důvodu neudělá. Ale je tam nějaký velký problém s pamětí, špatná alokace. Jeden problém na GitHubu hned vyřešili, ale pořád to blbne. Takže nevím, jestli to někdo aktivně s Intel kompilátorem a velkými vzorky používá.
Na test HPL nemá použití Intel kompilátoru vliv. On by použil ten BLAS z MKL, ten asi bude optimální, ale myslím si, že třeba ten OpenBlas na x86 je na tom stejně.