Možná by pro vás bylo zajímavé kódování UTF16(LE), které je mimochodem nativní ve Windows (řada NT). Výhody jednobajtového kódobání, jako rychlý skok na pozici, ale zároveň 99 % znakových sad, co se používají (smůlu byste měl až s málo používanými emotikony typu těhotný muž).
Nicméně co se týče operací se stringy, v C se procházejí postupně znak po znaku takjakotak (např. strlen). Tzn. z tohohle pohledu není UTF8 horší. Ono vůbec v UTF8 bylo myšleno na zpětnou komaptibilitu aspoň s 7-bit kódováním ASCII.
20. 11. 2023, 17:59 editováno autorem komentáře