No vidíš: „Nebo si to pustit v cloudu...“ A teď ta otázka - k čemu reálně bude sloužit ten cluster? Jako cloudový provider! Poběží tam nějaký openshift či openstack a uživatelé si budou škálovat virtuálky.
Navíc, nemysli si, některé typy výpočtů musíš pusti na svém železe, protože citlivá data. Pak je Ti ten Cloud u Amazonu/Google/MS/Kohokoliv dalšího k prdu.
Na druhou stranu, realita je taková, že výkon se pak přeprodává třetím stranám, nebo se reálně půlka vypne, aby se mohlo tvrdit, že běžící CPU jsou v průměru vytížená na třeba 66% (to nám to počítá woooha!).
Se zeptam, a co jste napocital vy?
Ja osobne zrovna v cloudech nepocital, ale spousta uloh simulujici fyzikalni problemy potrebuji co nejkratsi spojeni mezi mnoha procesory. Predstava ze si budou ulohy predavat vysledky nekde mezi cloudem na taiwanu a cloudem v emerice je naprosto usmevna, to si muzu rovnou pocitat doma na desktopu.
Očividně o tom mnoho nevíte. Výhodou těchto superpočítačů je, že mají rychlý interconnect (spojení mezi nody). To je potřeba pro numerická řešení diferenciálních rovnic. Typické problémy jsou kvantová chemie, počasí, aerodynamika a hydrodynamika. Tohle obyčejné cloudy (praktické zkušenosti mám s Microsoftím Azure) nenabízí. O využití v akademickém prostředí rozhoduje systém grantů. Napřed musíte naformulovat projekt. Pokud ho posuzovatelé vyhodnotí jako kvalitní, tak dostanete přidělený počítačový čas. Po skončení projektu musíte sepsat závěrečnou zprávu. (Záleží i na velikosti projektu, typické dělení je na velký, střední a malý projekt. Pro každou z těchto velikostí jsou trochu jiná pravidla.) Takhle to běžně funguje v zahraničí, předpokládám, že v ČR je to podobné. Komerční subjekty za počítačový čas platí.
Výhodou národních superpočítačových center je, že jejich technici mají výborné know-how. To u malých clusterů provozovaných na koleně často chybí. Zvlášť když se ti technici musí starat i o počítače s Windows.
Teď jsem si vzpomněl, že jsem slíbil jeden malý projekt pro výzkum umělé inteligence tenhle týden napsat ...
Ano, Myrinet a později InfiniBand. Současné statistiky jsou na webu https://www.top500.org/statistics/list/ (Interconnect). Nyní vede Ethernet (10G, 40G, 25G). Nějaký InfiniBand tam ještě je.
Kdyz nepocitas atomove bomby a neco tajne, tak je lepsi cloud. Pocitat neco mesic za cenu X nebo to same zvladnout za den za celkovou cloudovou cenu neco prez 2*X nebo i 3*X, to je na vyzkum jasny vyber. A treba Google ti jeste poskytne slevu nebo to i da zadarmo, kdyz jde o vyzkum co s velkou pravdepodobnosti prinese dobre PR.
Neefektivne vyuziti znamena, ze je ten cloud treba i levnejsi a potom superpocitac postraha sve vyhody.
Bohužel, ono často netřeba něco tajného počítat, stačí, když počítám blbou tlakovou nádobu a trubky a mám materiálové tabulky dodané se SW, pomocí kterých počítá jiná firma v US raketové motory do ICBM, či čeho, a už musím přistoupit na takové podmínky, že když s nadšením přiběhne cloudista s nabídkou výkona a předložím, že můžeme, ale musí splnit to a to, tak v lepším případě kouká jak vyděšená myš a v horším zavolá Policii z pokusu o vyvraždění celé jejich firmy. :-(
Cloud se vyplatí, pokud něco takového počítám relativně jednorázově, pokud jako komerční firma počítám fakticky trvale, tak se pak nedoplatím. A problém i bývá, pokud potřebuji veliké datasety, ono pak ztratím i dost času přesuny dat a uložení dat také něco stojí a i s přenosy to dokáže slušně naskákat, přestože prvotní nástřel, co stojí výkon CPU byl za pár drobných. :-(
Schování za výzkum je sleva, ale musí to jít přes nějakou vysokou školu, pak Google v podstatě poskytuje některým neomezené prostředky (nevím jak CPU, ale pro ukládání dat hrne jeden náě soused skrz jednu "regionální VŠ" tempem 8-10 PB dat/ročně do cloudu s uložením na 15 let zdarma).
Ono těch možností použití je docela dost málo a jedná se hlavně o farmaceutický průmysl, simulace. Většina těchto zákazníků používá hybridní cloudy a platí si je sami bez dotací.
Člověk by rád viděl, že tam budou provozovat něco pořádného, rád si za pár let poslechnu jak jsem se spletl. Nicméně ta šou už nějakou dobu běží...
Podle https://www.top500.org/system/179961/ běží na CentOS. Odhaduji, že na CentOS 8. To jsem zvědavý na co budou letos migrovat, když RedHat… Hádám, že na CentOS Stream asi ne.