To je dobra otazka. Sam som zvedavy na odpoved.
V ramci optimalizacie neviem ci by nebolo rychlejsie spravit toto ako 2 movb:
movw %%1, %ax rolw $8, %ax orw BITPLANE_SELECTOR, %ax
Aj ked podla rychleho pozretia uops je to za jedno.
Pri starsich CPU to malo vacsi vyznam, mozno mi ale nieco uchadza..