Zklamání jménem Aurora ukazuje na pokračující trápení Intelu

17. 11. 2023

Doba čtení: 14 minut

Líbí se vám článek?
Podpořte redakci

Intel dotáhl do finále projekt superpočítače Aurora a dokázal tak, že je také výrobcem, který je schopen ve velkém dodat jak CPU, tak GPU část. Je ale co oslavovat?

Je mnoho evergreenů, do kterých se kope vždy, kope za každého počasí, kope bez ohledu na stav burzy či hladinu alkoholu v krvi – kope se do nich při hladině nulové, stejně jako při hladině daleko za hranicí otravy ethanolem. Jeden takový spolehlivý evergreen je kopat do dobové aktuální vlády. Je jedno, jestli vládne Losna, nebo Mažňák, vždy bude část lidí nespokojena. Je také zcela klasické kopat do libovolného náboženství, od judaismu přes islám, po hinduismus. Je zcela klasické kopat do učitelů (protože berou moc), soudců (protože berou moc), lékařů (protože berou moc), politiků (protože berou moc) – třeba mi někdo jednoho dne vysvětlí, kdo tedy v tomto státě bere málo. Ale to odbíhám od podstaty.

Je také posledních zhruba 10 let klasické kopat do Intelu za to, že nevalí pokrok takovým tempem, jak jsme byli zvyklí. Kopání do Intelu se stalo součástí liturgie všech webů fandících AMD, jak kdysi pravil Igor z Nvidie, všech těch „komunistů rudejch až za ušima“ (pozn. pro mladší ročníky: barvy ATI byly tradičně červené). I já jsem kdysi kopal, ale jak jsem si postupem let sundal klapky z očí, kopat jsem přestal. Tak se dnes pojďme podívat na to, jestli si Intel tohle kopání zaslouží, a to na příkladu nejnovějším a nejzářnějším, na superpočítači Aurora, který v sobě shrnuje veškerou mizérii, strasti, bídu i zoufalství kdysi nepřekonatelné počítačové legendy řízené i samotným polobohem, Dr. Gordonem Moorem.

Co předcházelo Auroře a procesorů Sapphire Rapids a Ponte Vecchio

Dovolte mi to vzíti hodně obšírněji, protože počátky toho, proč je Intel na sklonku roku 2023 stále bit, zatímco AMD vyzdvihována, sahají více než dekádu do minulosti, skoro až dvě dekády. Intel totiž po většinu své životní pouti žil v pozici neporazitelné firmy. Bylo jen velmi málo unikátních momentů, kdy se šéfům firmy minimálně orosilo čelo hrůzou. Ten nejzářnější je moment, kdy AMD předběhla Intel doslova o pár dní s uvedením prvního 1GHz x86 CPU na trh. Athlon vyhrál, Pentium-III prohrálo a Craig Barrett řval na své podřízené.

Další hořkou pilulkou bylo nepochybně vítězství 64bitové instrukční sady AMD64 nad vlastním řešením Intelu (potažmo nad Itaniem, ale to je jiná kapitola). Ale jinak si veskrze žil Intel spokojeně a kdyby náhodou AMD mělo výhodnější produkty (jako třeba původní Ahtlony 64), tak Intel holt využil svého monopolního postavení a zatlačil na své odběratele. A kdyby to nestačilo, sama AMD si to tehdy pod Hectorem Ruizem hnojila seč mohla (neměla čipsety, neměla dostatečné výrobní kapacity, a tak Hector Ruiz, tehdy přezdívaný Hector Ruin, dal celou jednu výrobní várku těchto Athlonů zadarmo firmě HP – vzpomínáte na dobu, kdy obchody s repasovanými PC byly plny strojů HP s Athlony 64? Balo to tehdy takové zvláštní neopakovatelné zjevení).

Jenže přišla architektura Intel Conroe a následně Core 2 Duo a Core 2 Quad a Intelu se podařilo utéct AMD, vyhrát zase na dlouho konkurenční boj. Alespoň tedy zdánlivě, neb už v této době, někdy kolem 2007 křičeli lidé jako Theo de Raadt, že procesory Intel principiálně obsahují určité bezpečnostní problémy plynoucí z jejich architektury (dnes už víme: všechny ty predikční systémy, sdílené cache či Hyper-Threading). Zkrátka stavební prvky, které pomohly Intelu opět odskočit AMD, byly tím, co mu způsobilo megaprůšvih jménem Spectre + Meltdown (a později další a další a…).

Ale to jsme tehdy ještě nevěděli. Vzpomeňme však, na jaké úspěšné vlně se Intel vezl. C2D a C2Q byly základ, který postupně přešel z 65nm na 45nm výrobu. Kdo nechtěl dávat 7 tisíc za Core 2 Quad, koupil třeba pozdější dvoujádrové Pentium a přetaktoval jej z 2,93 GHz na stabilních 4,21 GHz pouhou změnou frekvence FSB (moje osobní zkušenost). Poté v roce 2008 přišla dostatečně vylepšená platforma Lynnfield, kterou dodnes mnozí používají a proti které AMD neměla pořádnou konkurenci. Ale skočme dál do přelomového roku 2011, kdy Intel v lednu uvedl 32nm procesory Sandy Bridge, reprezentované 4× CPU / 8× HT modelem Core i7–2600K, již s AVX a hlavně schopností nezřídka toto CPU změnou FSB popohnat z 3,4 na 4,5 GHz či výše (osobně jsem zapůjčený kus roky provozoval na 4,7 GHz) – pomineme-li vysokou spotřebu v takovém OC režimu, jde dodnes o solidní základ pro PC včetně méně náročného hraní her, a to už uběhlo od jeho uvedení skoro 13 let (ale stále tehdy zbývalo 7 let do odhalení Spectre/Meltdown).

Pak přišel Ivy Bridge, první 22nm generace, kde Intel přešel z planární výroby na FinFET. Dodnes stále vylepšenou variantu tohoto výrobního procesu nabízí a využívá se třeba pro čipsety.

Jenže to už byl počátek problémů. Z 32nm přešel Intel na 22nm, navíc s efektivnější konstrukcí tranzistorů, ale tomu nějak zásadně neodpovídal pokrok v IPC a hlavně zmizely úžasné OC možnosti Sandy Bridge – Intel zde totiž přešel od letování heatspreaderu na CPU die k jejich spojení běžnou bílou silikonovou pastou (to mělo své důvody, nicméně celá léta bylo a je toto kritizováno, zejména když AMD se stále držela letování a i dnes víme, že když provedete delid CPU Intel a pastu nahradíte tekutým kovem, případně zcela odstraníte heatspreader a chladíte přímo pouzdro CPU die jako v době Pentií III / Athlonů a Duronů, teploty v zátěži jdou klidně i o 20 °C dolů a s tím i spotřeba).

Zkrátka jakkoli byla generace Ivy Bridge dobrým produktem, už naznačovala, že valící se stroj nějak prapodivně zpomaluje. Ale znát to moc nebylo, pro Intel bylo zásadní výhodou, že AMD se tehdy ještě trápila se svou planární výrobou (dál než na 32 nm to nedotáhla) a TSMC před výrazně pozdějším přechodem k nabídce 16nm FinFET procesu dala světu katastroficky špatný 20nm planární proces (viz Qualcomm Snapdragon 805 či MediaTek Helio X20).

Intel tak (cca 2013–2015) vystačil s drobnějšími inovacemi 22nm procesu a architektonickými vylepšeními, které přinesla generace Haswell, zejména instrukční sadou AVX2. Haswell, potažmo Haswell Refresh, je dodnes plnohodnotně použitelnou platformou, ať již jde o čtyřjádra s 8×HT, nebo HEDT platformu Haswell-E, která na konci roku 2014 přinesla 8×CPU / 16×HT do desktopů, k tomu použití DDR4 a skvělý overclocking (tehdy mi zapůjčený testovací kit s Core i7–5960X šlo přetaktovat z 3,5 na 4,5 GHz naprosto stabilně se vzduchovým chladičem a ten procesor byl neskutečné dělo).

Teprve tímto momentem příchodu Haswellu-E se dostáváme do zlomového momentu, kdy v AMD po 3 letech skončil dočasný CEO Rory Read a kormidla už méně zmírající firmy se ujala Lisa Su. Jsme v době, kdy AMD neměla na trhu nic, co by mohlo konkurovat Intelu, maximálně pár produktů srovnatelných, ale za cenu výrazně nižších marží. Intel vládl, ale už jsme mohli tušit, že problém je doslova za rohem.

Ve stejné době jako Haswell-E totiž Intel pustil do světa první 14nm architekturu Broadwell, první procesory vyráběné vylepšenou verzí 22nm FinFET procesu, označenou nakonec za 14nm proces. První, u kterých se začaly objevovat problémy. Výroba nešla už tak hladce, nabídka najednou byla omezená. Nová generace nezamířila do běžných desktopů, tam vše Intel překlenul refreshem předchozí generace (už zmíněný Haswell Refresh) a Broadwell šel do hotových sestav, což mě osobně tehdy neskutečně štvalo zejména s ohledem na to, že verze CPU s nadčasovou iGPU architekturou Iris Pro s vlastní 128MB eDRAM fakt nebyly rozumně k dostání. A zrodil se i šíleně předražený, jakkoli skvělý až 10jádrový Broadwell-E.

Na to vše pak Intel i pro běžné desktopy v roce 2015 navázal s uvedením platformy Skylake, u které dnes už víme, že její zabugovanost byla primárním motivem, proč bylo v Applu rozhodnuto se s Intelem rozejít a vyvinout vlastní CPU řešení pro velké Macy. O lehce přes rok později, v lednu 2017, už Intel uvedl Kaby Lake, neboli jinak řečeno Skylake Refresh – opět zde musel sáhnout po refreshi, protože největší zádrhel se ukázal naplno na scéně: Intelu se nepovedlo včas dokončit 10nm výrobní proces.

Ani na konci roku 2017 nepřišla 10nm generace (zato přišly v létě od výzkumníků informace o věcech, které jsme pak v lednu 2018 poznali pod názvy Spectre a Meltdown), ale jen další refresh, architektura Coffee Lake, která ale už nemohla oproti AMD stavět jen na 4×CPU/8×HT, protože od března 2017 měla AMD na trhu 8×CPU/16×HT procesory jako Ryzen 1700 a 1800X, které nejenže měly 8 jader, ale hlavně architektura Zen dotahovala v IPC architekturu Skylake. Ještě to nebylo ono, ale bylo jasné, že se čtyřmi jádra už Intel nevystačí. Tak přišel Coffee Lake, který do fyzického pouzdra stavěného na 4 jádra a na výrobním procesu stavěném pro maximálně 4 jádra narval jader 6. Core i7–8700(K) ale ještě nebyl příliš za hranou fyzicky možného v dané procesorové patici. To byl problém až pro generaci následnou.

Jenže ta přišla až na jaře 2019, šlo opět o Coffee Lake, byť s až 8 jádry / 16×HT – model Core i9–9900(K). Tou dobou už rok hořela katastrofa jménem Spectre+Meltdown, a tak valná část výkonu, která přinesla dvojice jader navíc, spláchly výkonnostní propady plynoucí ze záplat těchto chyb.

A postupem let se záplatovaly další a další věci a do toho Intel stále nedokončil 10nm proces, zatímco AMD v poměrně rychlém sledu přešla od Ryzenu 1800X k Ryzenu 2700X, pak k Ryzenu 3950X s 16×CPU/32×HT, pak k Ryzenu 5950X, pak přinesla velkou 3D V-cache a vše završila novými Zen4 Ryzeny à la 7950X3D. S každou generací navyšovala IPC v průměru o nějakých 15 až 25 %, do toho uváděla HEDT Threadrippery, nejprve s 16, později 32, ještě později 64 a nyní 96 jádry / 192×HT a stejně vybavené EPYCy. Prostě lepila čiplety ve velkém, zatímco Intel se trápil s drahými 14nm obřími monolity typu HEDT modelů Core 7980XE – 9980XE – 10980XE.

Od roku 2017 až do současnosti Intelu naprosto totálně kardinálně katastroficky a všelijak jinak superlativně ujel vlak. Tomu Intelu, který tak dlouho žil ze své technologické nadřazenosti, spousty skvělých mozků ve výzkumu a vývoji, až se tím nechal uchlácholit, uspat a následně profackovat z jedné strany Lisou Su z AMD, z druhé strany Jen-Hsun Huangem z Nvidie.

Malá odbočka: od vzestupu AMD se čas od času vyrojovaly informace o tom, že probíhají jednání o tom, že by Intel koupil firmu Nvidia (poslední dobou spíše i ta, že by Nvidia koupila firmu Intel). Jenže Jen-Hsun si to prý měl podmiňovat tím, že v nové společnosti bude na pozici CEO (nelze se mu divit), což konzervy z Intelu nedokázaly přenést přes srdce. Když se ale dnes podíváme, kde je Nvidia (skromně řečeno: kraluje světu) a kde je Intel (diplomaticky řečeno: vyhlíží první posly se zprávou od hrobníka), možná by to býval byl dobrý krok. Ale nestal se a historie si na „co by, kdyby“ nehraje.

Názor, kde udělal Intel chybu

Tohle nemám nijak podložené, ale dle mého názoru udělal Intel za posledních 20 let jedinou velkou chybu, jejímž důsledkem je vše. Nejde o HT, Spectre, Meltdown, L1TF, všemožné *bleed chyby ani odmítnutí Jen-Hsuna. Jde o *nějakou* chybu v rozhodnutí, jak realizovat výrobní technologii FinFET. Někde na tomto bodě Intel nasedl na sáňky, které zpočátku možná vypadaly jako mířící dobrým směrem, ale stáčely se na trasu horší, kamenitou, plnou zatáček. TSMC zjevně své pojetí FinFET zvolila lépe, navíc nasadila dříve EUV litografii (byť později než, tuším, Samsung) a hlavně už víc než dekádu neustále navyšuje výrobní kapacity (dobré pro Apple, AMD i Nvidii či Qualcomm).

Horší kvalita a chybovost 14nm procesu Intel (od 5. generace Broadwell až po 11. generaci Rocket Lake) je toho důsledkem a extrémní prodleva v uvedení 10nm procesu (dnes značen Intel 7) taktéž. Něco, co tedy mělo být ve velkoobjemové sériové výrobě už v roce 2015, přišlo naplno řekněme letos s 13. generací Core. Pokud bychom se ale na tento výrobní proces podívali optikou roku 2013, kdy Intel o roce 2015 hovořil, tak bychom se museli shodnout, že ani s 14. generací Core z tohoto podzimu, která u nejvyšších modelů vykazuje spotřebu přes 300 W, se nebavíme o produktu takové kvality, jakou jsme od Intelu v roce 2013 či 2015 byli zvyklí.

Čili mizérie 10nm procesu trvá už 10 let, jsme v době, kdy tento proces měl být dáááávno opuštěn, ostatně on měl být opuštěn už i 7nm proces Intel 4 a Intel touto dobou měl být někde na úrovni 5nm či 4nm procesu, čili toho, čemu se říká Intel 3 či Intel 20A. Tam nejsme a ještě mnoho let nebudeme.

Pokud vůbec někdy budeme. A to je doslova katastrofa.

Raději snad ani nemluvme o fiasku jménem Project Larrabee, tedy Xeonech Phi. Tam Intel provařil nemálo miliard dolarů s nulovým výsledkem. A jak dopadly paměti Optane / 3DXPoint? Podobně.

Snahy Intelu o záchranu

Když se živíte rybolovem a vaše moře bylo až na nějaké malé čudly kompletně vyloveno, pak máte problém. Intel rybaří v rybníku, který je na pokraji vyhynutí, zatímco AMD se už před lety přesunula do bohatých vod Jihočínského moře u ostrova jménem Tchaj-wan (dobře, tohle přirovnání s ohledem na drastický čínský overfishing úplně nesedí, ale…). Bohužel se stále zdá, že Intel je schopen pouze inkrementálních vylepšení své architektury FinFET procesů, která ale stojí na principiálně špatných základech. Touto cestou nemá šanci AMD dohnat či předehnat a už není v jeho možnostech, aby překonal schopnosti TSMC – zde by jej spasila jedině nějaká černá labuť, třeba choutky pana Si na ostrov Tchaj-wan. Ale to nechce nikdo soudný na této planetě, opakuji: nikdo.

Intel se to snaží aspoň kompenzovat, ale pořád platí, že má fundamentálně špatnou výrobní technologii. Tu kompenzuje novými instrukcemi (třeba AVX-512, které ale po letech trápení daleko kvalitněji implementuje AMD do Ryzenů). Jindy kompenzuje lepšími možnostmi řízení chodu CPU (PL1, PL2, Tau), tu zkouší nasadit hybridní architekturu velkých a malých CPU jader a utápí mnoho a mnoho práce vývojářů na ladění CPU schedulerů. Jindy zase přetáhne z AMD šéfa vývoje GPU a pustí se do velkých GPU, které ale opět trápí léta odkladů, nezkušenost s výrobním procesem TSMC (se kterým má AMD i Nvidia obrovské zkušenosti; na vlastních Intel linkách ani výrobu nespouští), absence desítek let ovladačových optimalizací pro hry a herní enginy atd., až je šéf GPU odejít.

Je toho samozřejmě víc, ale nic z toho zatím nevede k cíli, jen brzdí rychlost ústupu ze slávy ve prospěch AMD. Ale ústup stále plynule pokračuje, Ryzeny vládnou více a více desktopům a herním konzolím, Radeony a GeForce zase grafickým a výpočetním kartám či AI systémům, serverům zase stále víc a víc vládnou EPYCy na úkor Xeonů.

Je to zkrátka špatné. Intel je provozně drahý, jeho akcionáři chtějí své dividendy, a tak i když je firma ve finanční bídě, dividendy vyplácí. Jak má pak zainvestovat tolik potřebný vývoj? Odpovědi netřeba. Intel je v IT světě zhruba ve stejné pozici jako Audi či BMW v automobilovém průmyslu. Ujel mu vlak, nedokázal se včas přizpůsobit radikální změně trhu a světa, a tak jej válcuje levná tchajwanská / čínská konkurence.

Článek o něčem jiném, než měl být

Na tomto místě se musím laskavému čtenářstvu omluvit. Původně jsem chtěl psát jiný komentář. Mělo to být o tom, jak mě štvou ty krátkozraké texty na adresu nového superpočítače Aurora. Chtěl jsem psát o tom, jak si mnozí novináři ani nepřečetli, že Aurora s Xeony a Xe-GPU ještě není kompletně dostavěna a že až bude, Frontier s EPYCy a Radeony překoná, byť za cenu vyšší spotřeby. Chtěl jsem psát o tom, že když si porovnáme počty jader a výkon, tak vlastně můžeme říci, že na poměry výrobních schopností Intelu to vůbec není špatné, a vlastně jej můžeme pochválit za to, že Xeony Sapphire Rapids a svá serverová GPU dotáhl do konce. Chtěl jsem psát o tom, že málokterý IT novinář (ostatně mě nevyjímaje) nerozumí tomu, co mohou přinést sw optimalizace, sw podpora a cílení na určité typy úloh. Ale ono by to vlastně bylo pokrytecké psaní.

Ano, dle mého není Aurora tak špatná, jak ji mnozí novináři vykreslují. Ale ona prostě není dobrá a přišla o 5 let později. Byť se povedlo projekt dotáhnout, je jen další ilustrací ústupu Intelu z výsluní, o čemž jsem ostatně psal už mnohokrát, naposledy letos na jaře.

Ono to jeho trápení není ani o nějaké Lise Su. Ta samozřejmě hrála a hraje naprosto nezastupitelnou roli při záchraně AMD z hrobníkovy lopaty. Ale AMD by dnes možná i tak neexistovala, kdyby nebylo Morrise Changa, kdyby nebylo provázanosti tchajwanské výstavní skříně jménem TSMC na Tchaj-wan jako takový. Jedině ona unikátní kombinace geopolitického a historického načasování, osobnosti Dr. Changa a dalších dílčích aspektů dala zrodu firmě, bez které by AMD byla dávno nostalgickou vzpomínkou, zhruba jako Cyrix.

Za mě existují v zásadě tři možnosti, jak se Intel může vzpamatovat. Za prvé dojde k nějaké opravdu špatné události na Tchaj-wanu a AMD přijde o svoje výrobní linky. Za druhé se Intel nějak vyhrabe z marasmu svých výrobních procesů. Za třetí se nechá koupit Nvidií (osobně věřím, že Jen-Hsun by radikálními kroky dostal Intel zase nahoru, jakkoli by to už nebyl ten Intel, který známe poslední desítky let). Pokud nenastane ani jedna z těchto variant, možná se Intel stane firmou, která bude jen nějak přežívat a plnit třeba strategické zakázky pro vládu USA, vyrábět na území USA. Bude méně vidět, byť poběží dál. Asi jako IBM. Netroufám si ještě říci naplno, že jej stihne osud právě oněch jiných amerických korporací, které jsou již jen nostalgickou vzpomínkou, jako byly procesory Motorola a původní IBM PowerPC, DEC Alpha, grafiky Matrox a podobné. Ale optimismus mě už opouští.

Vstoupit do diskuse (80 názorů)

David Ježek

Příznivec open-source rád píšící i o ne-IT tématech. Odpůrce softwarových patentů a omezování občanských svobod ve prospěch korporací.

Témata:

Intel

"V době Buldozerů AMD doporučovalo dělat FPU výpočty na GPU. Velmi dobré doporučení. Ne, místo toho se tehdy nadávalo na AMD, jak nezvládá FPU operace. Místo, aby se to počítalo na kartě, kde je těch FPU jednotek tisíce." To je dobré doporučení nebo totální blábol, podle toho o jaké výpočty jde. GPU má tisíce _pomalých_ fpu jednotek a navrch platíte brutální latencí. Pokud nemáte velká data vhodná pro SIMT, tak si můžete výpočty na GPU strčit do špic. Dále je třeba blbost paralelizovat…

JSH

Sdílet