Názor k článku Fenomén CPU Intel: výsledky testů značně různé, v čase nárůst výkonu i o desítky procent, Arrow Lake je tu od msmucr - Nejbližší standardizovaná věc s více "nodes" je asi...

  • 28. 10. 2024 1:51

    msmucr
    Bronzový podporovatel

    Nejbližší standardizovaná věc s více "nodes" je asi NUMA, ale to je trošku jiná záležitost, která řeší primárně lokalitu a adresaci paměti. Na některých EPYCech se dá přepnout nastavení L3AsNumaNode, kdy to fakticky udělá pro každý čiplet jeden node a bude to nejspíš míněno přesně na nějaké aplikace, co mají detekci NUMA nodů a specificky to třeba seskupí workery, které pak využijí sdílenou L3 cache a menší latenci v rámci CCX.
    Viděl jsem to např. na severu s Milan 7003 EPYCy, ale nepoužívám to.

    Jinak programově se dá topologie systému včetně všech úrovní cache dá zjišťovat třeba přes hwloc, resp. libhwloc.
    https://www.open-mpi.org/projects/hwloc/
    To bylo, podle mě, právě vymyšleno pro multiplatformní výpočetní aplikace tak, aby nemusely každá individuálně řešit runtime detekci topologie na různých systémech, platformách. Mimo CPU to podporuje i detekci dalších výpočetních zařízení přes různá API (CUDA, ROCm, OpenCL).
    Ale nejsem "počtář" ;)