Minulý týden v sobotu Noah Goldstein poslal do knihovny Glibc zrychlené operace s řetězci na procesorech x86 pomocí AVX2 a EVEX (AVX-256 (EVEX) tedy AVX-512VL, kde se používá jen poloviční délka registrů a mělo by se zabránit podtaktování při použití AVX-512 plné délky).
Zrychlení u funkce str{n}casecmp
je oproti SSE4.2 asi 30 % u AVX2 a asi 38 % u EVEX. Zároveň bude odstraněna varianta s instrukcemi AVX. Jednak nabízí oproti SSE4.2 zrychlení jen asi jen 3 % a také se týká jen procesorů Sandy Bridge a Ivy Bridge, které jsou již zastaralé. Novější procesory budou využívat rychlejší AVX2 a EVEX verze.
(zdroj: phoronix)