Funkce csum_partial v jádře počítá 32bitový kontrolní součet dat. Používá se ve spoustě ovladačů, v síťování a v souborových systémech. Je napsaná ručně v assembleru a Noah Goldstein poslal do jádra upravenou verzi pro x86 s lepším výkonem.
Je zaveden speciální případ pro 40 bytů (třeba IPv6 hlavička), což je nejčastěji používaná délka v jádře. Pro tento případ klesne latence o 8–9 % a vzroste rychlost o asi 30 % na Intel Icelake. Nevýhoda je, že lehce vzroste latence pro ostatní délky o asi 5 %.
Dále byla vylepšena 64bytová smyčka aby se využilo paralelní zpracování operací, to pomůže výkonu pro velké délky. Zde se latence i výkon zlepší o asi 40 %. Vylepšená funkce csum_partial se dostane patrně do jádra 6.5.
(zdroj: phoronix)