OK, bohužel u obrazu narazíš na to, že ta GPU implementace umí jenom 1D FFT o velikosti 2^N.
Zajímalo by mě, jestli se DCT 8x8 vyplatí počítat na GPU -- čekal bych, že samotné provedení takto malé DCT bude dost rychlé, a overhead spojený s kopírováním dat tam a zpátky bude dominovat.