Složitý slepenec u Intelů vůbec poprvé
Úvodem mi dovolte ve stručnosti připomenout hardwarovou stránku věci, neb ta je dosti podstatná. Až dosud si desktopové/notebookové procesory vyráběl Intel sám. Konkurenční AMD před několika lety přešla na tzv. čiplety, tedy sestavování CPU z více dílčích čipů, což efektivně obchází limity současných výrobních technologií zejména co se výtěžnosti týče.
AMD zvolila relativně jednoduchou a praktickou formu, kdy na podkladovém pouzdře CPU nalepuje vedle sebe čiplety CPU a IO částí. Intel proti tomu po léta vymýšlel vlastní složitější pouzdřící technologii Foveros, se kterou chtěl dělat HPC slepence Ponte Vecchio s desítkami čipletů alias dlaždic, jak jim Intel říká (což mu tak úplně nevyšlo) a tuto technologii tedy nyní nasazuje s Meteor Lake.
Tam, kde typicky AMD používá poměrně unifikovanou architekturu slepování, která je značně praktická a lehčí na výrobu, Intel přímo k sobě lepí dlaždice od více výrobců. Jeho řešení je tak komplikovanější, ale pokud jej dobře vychytal, tak to klidně může znamenat jen toliko, že lepení dlaždic nasazuje až dnes, ale jinak z něj odteď bude benefitovat. Vzpomeňme však historicky, že Intel už dříve lepil samostatné kusy křemíku více výrobců, to kdy zkusil ke svým procesorům lepit Radeon Vega od AMD (viz např. dobový text s fotkou u Wcftech), případně pouzdřit dva kousky CPU křemíků u Core 2 Quad (zatímco AMD tehdy vyráběla Phenom X4 monolitickou formou).
Zkrátka pouzdří se více křemíků do jednoho pouzdra už mnoho let, ale posouváme se od primitivnějších forem pouzdření ke složitějším a i AMD zde nadále posouvá hranice, například svými procesory typu Ryzen X3D s přídavnou obří V-cache die.
Meteor Lake konkrétně obsahuje CPU dlaždici (křemík s CPU jádry vyráběnými procesem Intel 4, dříve značeným jako 7nm), Graphics/GPU dlaždici (výroba 5nm TSMC), SoC dlaždici (výroba 6nm TSMC) a IO dlaždici (výroba 6nm TSMC). Většinu procesoru tedy vlastně vyrábí TSMC a ač hlavní balíky procesorových jader nese dlaždici vyráběnou Intelem, i v SoC dlaždici najdeme malá CPU jádra, na této dlaždici ostatně Intel ukazoval akceleraci 8k videa bez aktivace CPU a GPU dlaždic.
Proč Intel většinu těchto křemíkových prvků Meteor Lake vyrábí u TSMC, těžko říci. Zčásti mohou být důvodem výrobní kapacity Intel 4, zčásti výtěžnost výroby, zčásti lepší výsledný produkt z 6nm, resp. 5nm procesu TSMC ve srovnání s Intel 4 a ostatně výroba CPU dlaždice přímo Intelem může být jen zoufalá snaha udržet si onu prestiž, že si CPU vyrábí sám, jakkoli by to nejspíš s 5nm TSMC procesem dopadlo co do výkonu či poměru výkon/spotřeba ještě lépe než s Intel 4. Ale to je ryze moje spekulace, též může jít i holou potřebu na CPU dlaždici Meteoru ukázat potenciálním fabless zákazníkům Intel Foundry Services, že je to dobré, ve stylu logiky „kdo si od daného státu koupí nové stíhačky, pokud s nimi nelétá vlastní armáda toho státu?“.
Architektonické věci
Meteor Lake opět trochu posouvá architekturu CPU jader k vyšším IPC. Spíše ale v posledních týdnech zaznívaly informace na adresu GPU části, která má být o desítky procent lepší než předchozí generace Xe (tedy ta, kterou nesou i současné desktopové procesory Intelu). Než se blíže pustíme do povídání o měřeních Phoronixu, zdá se, že i s ohledem na stále probíhající vývoj softwarové podpory na Linuxu to vypadá, že se potvrzuje následující: CPU část nijak zvlášť nepokročila, GPU část pokročila vpřed velkým skokem.
Dosavadní procesory Intelu, například desktopový Raptor Lake 13. a 14. generace Core, používají CPU jádra ve verzi P (Performance) architektury Raptor Cove (větší L2 a novější prefetch algoritmy oproti Golden Cove z 12. generace Core Alder Lake) a ve verzi E (Efficient) jde o Gracemont (stejná architektura u 12., 13. i 14. generace Core Alder / Raptor Lake / RL-Refresh).
Oproti tomu Meteor Lake přináší architektury Redwood Cove + Crestmont, a to konkrétně až v konfiguraci až 6× Redwood Cove (P jádra) + 8× Crestmont (E jádra) + 2× Crestmont (lowpower E jádra v SoC tile). Na detaily je Intel poměrně skoupý, jistá vylepšení jsou, například na úrovni Thread Directoru, případně podpory AI akcelerace u E jader (VNNI atd.) či vylepšené predikci větvení a opět Thread Directoru. Můžeme tak pouze mlhavě soudit, že Intel na hardwarové úrovni zapracoval na rozdělování úloh mezi P a E jádra (čemuž také musí přizpůsobit sw vrstvu) a mírně vylepšil samotné mikroarchitektury.
Zbytek pokroku už jde na bedra výrobního procesu a schopnosti dávat vyšší takty při daném odběru / spotřebě / zahřívání, což plyne z přechodu od výrobního procesu 10nm/Intel 7 na 7nm/Intel 4.
Předběžné a hrubé porovnání testovaných strojů AMD a Intel
Nyní už k testům, které provedl Michael Larabel na Phoronixu. Jde o test CPU části a test GPU části. Předně pár slov, kterými test uvozuje. Jím testovaný notebook s Meteor Lake je stroj, který koupil v den uvedení na trh, tedy žádný výběrový vzorek od Intelu. Pochválil obecnou dostupnost na trhu v den uvedení, kdy u AMD se obvykle čekají týdny až měsíce na dostupnost na trhu.
Šlo o 14" notebook Acer Swift Go 14, vybavený Intel Core Ultra 7 155H s integrovanou grafikou Intel Arc, 16GB LPDDR5×, 1TB M.2 NVMe, dotykovým displejem s rozlišením 1920×1200 a obvyklou konektorovou výbavou, to vše v ceně 999 USD.
Samotný procesor je 16jádrový (6×P + 8×E + 2×LP E, jak je uvedeno výše v článku), resp. 22vláknový. Na výkonnějších až 4,8GHz P jádrech je tedy k dispozici 12 vláken, zbytek jde na bedra nižších E jader. Procesor je nastaven na TDP 28W s maximální Turbo spotřebou 115W, a iGPU jádrem běžícím až na 2,25GHz, plus podpora Intel AI Boost v rámci integrovaného NPU.
Proti tomuto notebooku postavil Michael jiný laptop, konkrétně Framework 13 s AMD Ryzen 7 7840U, což je Zen4 osmijádro / 16vlákno s taktem až 5,1GHz boost clock, TDP 28 W a integrovanou grafikou RDNA3 generace zvanou Radeon 780M, plus Ryzen AI jádry (ta nejsou aktuálně na Linuxu podporována a Michael se podpoře AI u obou procesorů v testu nevěnoval, ale ještě se k Ryzen AI vrátíme).
Konkrétní testovaný Ryzen laptop je dražší, ale toto kritérium z hodnocení vynechme, jiné notebooky s Ryzen 7 7840U se pohybují na českém trhu zhruba od 34 po 45 tisíc Kč. U Aceru s Meteor Lake ještě nelze českou cenu říci, v nabídce je zde zatím předchozí generace (Raptor Lake s Intel Xe a 16GB/1TB), v ceně kolem 25 tisíc Kč.
Z tohoto hlediska, kdy předchozí generace stojí v ČR 25 tisíc a nová generace v zahraničí 999 USD (přímý přepočet 22 tisíc Kč, který jistě čeští obchodníci nezvýší na dvojnásobek) lze předběžně usuzovat, že bude tento Acer Swift 14 s Meteor Lake výrazně cenově výhodnější než notebooky s Ryzenem 7 7840U, avšak to konstatuji bez porovnání např. mechanické kvality stroje.
Softwarová podpora na Linuxu
V září jsme psali, že podpora iGPU Meteor Lake je hotová. V srpnu jak Intel upravuje podporu multimédií pro Meteor Lake do samostatné podoby (viz video výše z přehráváním 8k obsahu bez CPU a GPU dlaždice) a kterak do jádra právě zamířily první patche pro tuto věc. Přibyl také aktualizovaný Intel Media Driver. Celý tento rok, například v červnu o VRR eDP či květnu (plus také související zjištění o L4 cache) či dubnu, jsme průběžně psali o vylepšování podpory hybridních CPU architektur, a to i v kontextu blížícího se Meteor Lake. Přesto se vše nestihlo včas.
Michael v testu tak uvádí, že výchozí Linux 6.6 s Ubuntu 23.10 nebyl použitelný, takže nakonec testoval s rc5 verzí Linuxu 6.7 + vývojovou verzí Mesa 24.0 – toto je podstatné pro pochopení aktuálně platné věci, a sice že vaše zkušenost s Meteor Lake na Linuxu s nějakou standardní distribuční verzí jádra a Mesa může být odlišná od toho, co tvrdí Phoronix v testu. A totéž platí pro Windows 11. Ale dokončované jádro 6.7 a vyvíjená Mesa 24.0 jsou dobrými náhledy na to, jak na tom Meteor Lake bude příští rok.
Testy CPU
Osobně bych nerad kompletně vykradl Michaelův test na Phoronixu, proto ideálně zamiřte k němu. Já vypichuji pár věcí, které neodpovídají současnému narativu kolem Intelu (pomalejší než AMD, výrazně žravější než AMD).
V testech prohlížečů konzistentně platilo, že Ryzen dává vyšší výkon než Core. Ne až tak zásadně, tu a tam byl i rozdíl zcela minimální a zanedbatelný, ale Ryzen je o trochu rychlejší. Phoronix ale konstatuje, že Ryzen více papá, konkrétně v průměru 6611 joulů/běh oproti 3013 joulům/běh.
Meteor Lake díky SoC vykazuje v průměru o 1 W nižší spotřebu (což je u úsporných mobilních platforem dostatečně zajímavý rozdíl, jakkoli na hraně měřitelnosti), pouze v situacích vyžadujících krátký nápor CPU výkonu je hladovější: Core 42W vs. Ryzen 35W ve WebAssembly – tohle bude důsledek vlastnosti CPU Intelu, které se po kratičké momenty více pouštějí na násobky TDP, pokud nepřešvihnou limity teplot/napájení, než je tomu u CPU AMD.
V kódování videa přes CPU je většinově rychlejší AMD, menšinově Intel. Obecně to platí pro použité kodéry jako SVT-AV1, x265 či VVenC a uvg266. Phoronix upozorňuje, že u SVT-AV1 vykazoval Meteor Lake značný rozptyl naměřených hodnot pro více průběhů, což naznačuje, že platforma neumí vždy správně rozhodnout, jestli úloha poběží na P jádrech či E jádrech, případně ji přehazuje mezi různými typy jader.
Pro audio platí totéž, Ryzen je o něco rychlejší (FLAC i MP3 komprese), zde ale osobně vyhodnocuji vliv jako nepodstatný, zas tolik hudby už dnes člověk nekóduje a i kdyby, tak komprimace audia je typicky řádově kratší proces než komprimace videa. Pro spotřebu při kódování audia platí dle Phoronixu zhruba totéž co níže pro Blender: Intel nejenže je pomalejší, ale má vyšší spotřebu.
Ryzen je solidně rychlejší v Blenderu 4.0, úlohy zvládá o zhruba 10 až 25% rychleji než nové Core, a to při v průměru solidně nižší spotřebě: 59251 joulů na běh u Core oproti 45101 joulů na běh u AMD. Zde tedy Intel drží své CPU nad hranicí optimálního poměru výkon/spotřeba, pro Blenderisty bude i současný Ryzen výrazně vhodnější tam kde práce s Blenderem bude stát ryze na CPU, nikoli na GPU akceleraci.
V testech Neural Magic DeepSparse zcela jasně vévodí AMD, jeho CPU má podporu AVX-512, které DeepSparse využívá. Podobně výrazně lepší je AMD u PyTorch či OpenVINO (Phoronix ale dodává, že tento test provedl bez NPU jednotek v CPU Intel).
U foto testů darktable + Rawtherapee + GIMP si o trochu lépe vede Ryzen, jeho spotřeba je přitom o trochu nižší než u Meteor Lake. Podobně je to s GEGL operacemi či převodem SVG do PNG v Inkscape.
Celkově tedy lze v tuto chvíli a pro tyto verze softwarového systému (Linux 6.7, Mesa 24.0 atd.) konstatovat, že Meteor Lake není žádný zázrak, ale podařilo se mu slušně dohnat současné Ryzeny, byť někdy za cenu o trochu vyšší spotřeby. Jestli je to pro daného uživatele dealbreaker, nebo ne, je už na posouzení každého.
Phoronix bude dále Meteor Lake testovat. Nejzajímavějším možná bude nakonec budoucí test srovnávající výkon s Ubuntu versus Windows 11. Uvidíme, nakolik lze výše uvedené horší výsledky hodit na bedra Meteoru po stránce hardwarové či po stránce softwarové, kdy typicky podpora ve Windows je na vyšší úrovni než v Linuxu.
Testy GPU
Použitý procesor Core 7 Ultra 155H disponuje GPU částí s 8 Xe jádry nové generace na taktu až 2,25 GHz. Tato GPU část podporuje hardwarový raytracing a umí výstupy typu DisplayPort 2.1 + HDMI 2.1, výrobce stroje tedy může vyvést ven obraz až do 8k/60p a nechybí ani hardwarové kódování videa včetně AV1. Celkově je GPU na podobné úrovni jako cokoli současného od konkurenčních výrobců (AMD, Nvidia).
Intel na Linuxu podporuje své produkty open-source ovladači, plus v rámci věcí jako Intel Compute Runtime for OpenCL či oneAPI Level Zero. Aktuálně pro co nejlepší běh Meteor Lake je potřeba volit vývojovou verzi jádra Linux 6.7 (či vyšší) a vývojovou verzi Mesa 24.0. Za měsíc-dva to budou běžné distribuční záležitosti.
Porovnání nového GPU Xe s 8 jádry a taktem 2,25 GHz proběhlo oproti Ryzenu s RDNA3 GPU s 12 jádry a taktem 2,7 GHz, Phoronix také přidal měření starší mobilní platformy Intelu, GPU Iris Xe v Core i7 128P s 96 EU a 1,45GHZ taktem (generace Alder Lake). Hodnoty měření spotřeby byly čteny přes rozhraní RAPL/PowerCap (na Linuxu u těchto platforem standardně používaná).
Podrobnosti provedených úvodních měření jsou k dispozici v testu Phoronixu. Jen stručně okomentujme, že typicky je Intel Core rychlejší a jeho spotřeba nižší než je tomu u AMD Ryzenu. Navíc jde pro Intel o obrovský skok vpřed oproti 12. generaci Alder Lake. Plus také víme, že tato čísla se budou nadále měnit k lepšímu, neb vývoj a optimalizace stále probíhají.
Neznamená to, že by Ryzen s RDNA3 Radeonem byl špatný, jde o velmi dobré řešení, avšak jeho odstup od nového Intelu se značně zmenšil, ač stále existují dílčí testy, kde vítězí. To vše ale zasaďme do kontextu cenového, kdy nejlevnější stroj s uvedeným Ryzenem je někde mezi 32 a 45 tisíc Kč, zatímco testovaný Meteor Lake v podání Acer Swift půjde koupit nejspíš v podobné cenové hladině jako předchůdce, tedy odhadem 25 až 30 tisíc Kč. Intel tedy bude levnější.
Compute testy
Phoronix završuje svůj test poslední stránkou věnovanou výpočetním aspektům iGPU u obou platforem. Konstatuje, že u Intelu je podpora pro Meteor Lake připravena, a to v rámci Intel Compute-Runtime s podporou OpenCL 3.0, dále oneAPI Level Zero a IGC, kdy vše na Linuxu 6.7 prostě funguje.
Naproti tomu u AMD jde bídu, její rozhraní ROCm oficiálně nepodporuje integrované grafiky a i pro spotřebitelské karty Radeon je podpora zmatečná, nemluvě o tom, že binárky ROCm jsou omezené na vybrané verze konkrétních enterprise distribucí.
Podpora Meteor Lake tak funguje třeba i pro Blender 4.0 se SYCL/L0 a Phoronix tak věc mohl otestovat. V grafech pochopitelně chybí měření Ryzenu 7040U, protože jeho GPU prostě takovou akceleraci neumožňuje. Srovnání Meteor Lake s Alder Lake ukazuje obrovský výkonnostní skok vpřed při současném výrazném poklesu spotřeby.
Hodnocení Meteor Lake (prosinec 2023)
Co říci závěrem. Nejčastější hodnotící slovo v testu GPU části u Phoronixu bylo terrific. Ano, i kdyby to byla jen z poloviny pravda, Intel ukázal úžasný skok vpřed v kvalitě a výkonu svého iGPU. Dík jistě patří i TSMC, která mu tuhle dlaždici do procesoru vyrobila.
S CPU částí je to horší, tam by se dalo říci obligátní „hmm a co dál?“ Zde Intel předvedl jen mírný posuv vpřed, nic co by zatočilo s již běžně dostupnou konkurencí. V recenzích mu nepochybně uškodí ta snaha ždímat poměr výkon/spotřeba do kompromisu, kdy měření dopadne o něco hůř než u Ryzenu při spotřebě o něco horší než u Ryzenu. Zkrátka takové nemastné-neslané. Ale ve výsledku si, opět se vracím výše ke GPU, člověk zahraje lépe než se současným mobilním Ryzenem, a to přitom Intel výrazně snížil spotřebu svého procesoru.
Pokud se potvrdí můj odhad ceny na základě předchozí generace, bude Meteor Lake velmi zajímavým a konkurenceschopným řešením oproti současné nabídce AMD. A dvojnásob to bude platit pro Linux, kde se zdá, že softwarová podpora Intelu je v pokročilejší fázi než to, co nabízí AMD. Ale to vše se bude v nadcházejících týdnech – měsících – letech vyvíjet.
Dnes samozřejmě vycházíme z jediného testu jediného člověka, protože kdo má v ruce notebook s Meteor Lake, je typicky redaktor hardwarového webu testující na Windows 11. Uvidíme, v jakém světle ukáží Meteor Lake zkušenosti uživatelů, kteří si takový notebook zakoupí. Já osobně jako uživatel desktopu závěrem roku přeji Intelu, aby se mu příští desktopová generace Arrow Lake povedla alespoň tak, jak se mu to podařilo s Meteor Lake v noteboocích, protože takhle moc svižnější iGPU, navíc s podporou Compute a AI, by bylo opravdu báječným skokem vpřed pro desktopy s Core v LGA patici.