To není jen ARM, protože licencovaných jader je v oblasti MCU docela dost, z oblasti vyššího výkonu jsou to třeba IP-core s MIPSem. Ale k otázce - mám pocit, že Infineon licence neprodává a jádra, která si vyvinul sám (což je TriCore, ale už ne osmibitové a 16bitové MCU), i sám vyrábí. Nejde totiž jen o jádra, ale spíš o celé čipy, kde jádro je relativně malá část a okolo připojenými moduly.
jeste premyslim nad temi LOOPy jakto ze jsou tak rychle ("zadarmo"). Podle me musi byt prvni iterace stejne pomala jako jiny skok, protoze se vysype pipeline etc. etc. Az potom si to procesor zapamatuje "tady bude skok, pujdes jinou cestou, kterou uz znas". Samozrejme ze pocitadlo iteraci taky otestuje dopredu s naskokem rekneme 2 instrukci, zase kvuli pipeline. Takze LOOP i LOOPU asi (pokud tomu rozumim) musi byt vzdy zpet.
První iterace může být lineární běh programu a pokud jde definovaný krok definovanýho registru, dá se skok dobře predikovat a v poslední iteraci mít včas připravenou adresu, aby se nezahazovala pipeline. Takže v podstatě zbude ošetřit výjimky jako nula iterací s podmínkou na vstupu.