Takže něco jako instrukce pro kopírování bloku? Tam je read, write, inc read pointeru, inc write pointeru, dec čítače, kontrola meze čítače, skok. Sedm instrukcí. Pokud to nedělá chomták, tak RISC jádro hodí bez problémů 3-5 řezů, takže podmínka je splněna a i během průchodu je bez predikce připravený na konec (jenom aktualizuje výsledky při každým průchodu, prostor na to je). A má přednačtený v cache, s čím bude dělat po konci cyklu.
Btw, čím víc řezů pipeline, tím víc rozdělané a míň dokončené práce při stejným taktu máš.