Intel nedávno vydal open-source knihovnu hlavičkových souborů C++ pro vysoce výkonné řazení založené na SIMD, která se zpočátku zaměřuje na velmi rychlou implementaci třídění pomocí instrukcí AVX-512. Tento kód byl nyní začleněn do Numpy a zrychluje řazení 10× až 17×.
Numpy vektorizuje algoritmus quicksort pro 16bitové a 64bitové datové typy pomocí AVX-512. Na procesoru Intel Tigerlake to zrychlilo 16bitové třídění typu int až 17×, zatímco 64bitové třídění float téměř 10× pro náhodná pole a 32bitové datové typy byly 12× až 13× rychlejší. Začlenění do Numpy provedl Raghuveer Devulapalli ze společnosti Intel.