Článek, zdá se, trochu zmatkuje i v případě paměťových nároků. Pro jednotlivé rozsahy a kódování by náročnost měla být tato:
unicode rozsah | UTF-8 | UTF-16 | UTF-32 -------------------------------------------------- 0000 0000 - 0000 007F | 1B | 2B | 4B 0000 0080 - 0000 07FF | 2B | 2B | 4B 0000 0800 - 0000 FFFF | 3B | 2B | 4B 0001 0000 - 0010 FFFF | 4B | 4B | 4B
UTF-8 je tedy horší než UTF-16 na rozsahu 0800-FFFF, a to pouze o jeden bajt.
Co se týče v článku zmíněné cyrilice, ta používá rozsah 0400-04FF. Její znaky tedy zaberou jak v UTF-8 tak v UTF-16 shodně dva bajty. Dokonce i na tu arabštinu (rozsah 0600-06FF) u obou vystačí ještě dva bajty.