Názor k článku Použití instrukcí SSE a AVX pro zrychlení bitových operací od linuxák - Lookup table má dva problémy, způsobuje cache thrashing...

  • Článek je starý, nové názory již nelze přidávat.
  • 23. 11. 2022 10:23

    linuxák

    Lookup table má dva problémy, způsobuje cache thrashing a nejde moc dobře vektorizovat.

    Cache thrashing bývá u takových algoritmů s požadavky na vysokou propustnost docela problém, protože je nutné, aby bylo pokud možno všechno v L1 cache, jinak hodně rostou latence, když se čeká na paměť.

    Pro konverze int na float existují SIMD instrukce s relativně nízkou latencí, např. _mm_cvtepi32_ps, což je obvykle lepší volba, než lookup table.