Doménová jména s národními znaky opět na scéně

8. 11. 2006
Doba čtení: 7 minut

Sdílet

V souvislosti s vydáním MSIE 7 se začíná opět otevírat téma národních doménových jmen. Nový Internet Explorer umí s těmito doménami pracovat a tak teoreticky nic nebrání rozšíření počtu domén. Jak funguje podpora národních znaků v doménách? Jaké má nasazení těchto domén nevýhody? Chceme vůbec jejich podporu?

Co je to IDN?

Pokud se budete někdy o tuto problematiku zajímat, pravděpodobně narazíte na zkratku IDN. Ta znamená Internationalized Domain Name, což můžeme přeložit jako mezinárodní doménové jméno. Zjednodušeně řečeno dovoluje tento systém používat v doménách národní znaky.

Od začátku existence systému DNS bylo možno používat domény druhého řádu o délce maximálně 63 znaků, které obsahují jen čísla, písmena ASCII sady (tj. A-Z) a pomlčku. Pomlčka navíc nesmí být použita na začátku doménového jména, to jen pro úplnost.

Tento jasný a striktní systém s sebou přinášel jasná pravidla a především pořádek. Člověk je ovšem jak známo tvor nespokojený a přestože internet je ve velké míře anglicky hovořícím médiem, najde se i celá řada jiných národů. Mezi ně samozřejmě patří i Češi a Slováci.

Tyto národy chtěly mít vlastní domény, ve kterých by mohly využít všechny národní znaky a domény by tak nemusely být (například) ceske, ale mohly by být skutečně české.

Jak to funguje?

Návrh podpory národních znaků v doménách není žádnou novinkou. Poprvé se objevil už před více než deseti lety. V roce 1996 jej vymyslel M. Duerst a o dva roky později byl T. W. Tanem poprvé implementován. Později byla podpora IDN v aplikacích uznána za standard s názvem IDNA (Internationalizing Domain Names in Applications).

Standard umožnil použít speciální algoritmus pro překlad ne-ASCII znaků do ASCII znaků. To byl pochopitelně nutný krok, protože DNS neobsahují žádnou podporu pro jiné než ASCII znaky a stále se musí držet původních standardů. Změna těchto standardů a především výměna DNS na celém internetu by byl velmi zdlouhavý ne-li neuskutečnitelný proces.

Proto byl vymyšlen systém převodu znaků. Ten musí podporovat prohlížeč a vůbec všechny aplikace, které by měly národních domén využít (tedy především ten prohlížeč). Software tak musí obsahovat algoritmus pro převod, pomocí kterého získá upravenou podobu doménového jména pro DNS systém. Uživateli ale stále ukazuje národní podobu jména.

Převod je pak uskutečněn ve třech fázích:

V první je použit algoritmus Nameprep, který provede úpravu některých znaků, například velká písmena jsou převedena na malá a podobně. Nameprep je definován RFC 3491 a RFC 3451.

Druhá fáze se nazývá Punycode a zahrnuje samotný převod. ASCII znaky zůstanou nedotčeny a ostatní znaky jsou převedeny na sekvenci ASCII. Nemusí se jednat jen o písmena s diakritikou, ale vlastně o všechny znaky, které jsou k dispozici v Unicode. Převod je definován v RFC 3492.

Třetí fáze pak zajistí identifikaci IDN doménového jména pomocí sekvence xn–, která je přidána před celé doménové jméno. A je hotovo.

Ukážeme si to na konkrétním příkladu. Řekněme, že bychom chtěli konvertovat doménové jméno slunečnice.cz. Doména prvního řádu (.cz) je v ASCII a software ji proto přeskočí. Pak narazí na doménu druhého řádu. Nejprve vezme všechny ASCII znaky, které není potřeba měnit, a za ně pak vloží kód, který charakterizuje jednak samotný znak č, ale také jeho polohu ve slově slunečnice. Nakonec před výsledek přidá předponu xn–.

Výsledek převodu doménového jména slunečnice.cz bude tedy vypadat následovně: xn–slunenice-pfb.cz. Takto bude požadavek předán k vyřízení DNS. Jak vidíte, jedná se o běžnou ASCII doménu, takže by měla být bez potíží vyřízena.

Tento postup má jednu podmínku. Je jasně vidět, že se nám doménové jméno při transformaci prodloužilo z deseti na sedmnáct znaků. Protože ASCII domény mohou mít maximálně 63 znaků, snižuje se nám délka národních doménových jmen. Samozřejmě to v praxi asi nebude mnoha uživatelům vadit, ale je potřeba si na to dát pozor.

Kde to funguje?

První doménou, kde bylo možno mezinárodní domény registrovat, byla doména .jp, a to počínaje červencem 2003. Další registrátoři zavedli podporu IDN počátkem roku 2004. V současné době už IDN podporuje poměrně velké množství různých registrátorů.

Dnes si můžete pořídit mezinárodní doménu v doméně .de, .com, .info, .net, .org, .pl a v desítkách dalších. Podpora je dnes již opravdu široká. V doméně .cz nejsou zatím IDN jména podporována. Podle VeriSign ale už bylo zaregistrováno více než 600 000 doménových jmen s národními znaky jen v doménách .com a .net.

Pro zajímavost několik odkazů na funkční domény s národními znaky:

宜家.com, عربي.com, שלום.com, 한글.kr, وب.سمپاد.ایران­.ir, เกมส์.com, Bücher.ch, доменные-имена.com

Podpora v prohlížečích

Do nedávna dělal problémy s IDN nejrozšířenější prohlížeč (ať chceme nebo ne) Internet Explorer. Ten byl schopen národní domény zpracovat jen s přídavným modulem. To samozřejmě řadu uživatelů i registrátorů zatím odrazovalo. Argument byl zcela oprávněný: většina uživatelů by se stejně na doménu nedostala.

Podpora v ostatních prohlížečích je ovšem už dlouhou dobu velmi dobrá. Mozilla Suite (od verze 1.4), Opera (od 7.11), Netscape (od 7.1) a Safari IDN podporují. Samozřejmě také Firefox, který z původní Mozilla Suite vlastně vzešel.

Zajímavá fakta o doménových jménech

Máte skvělý nápad na nový web nebo chcete vydat novou úžasnou aplikaci. Teď budete potřebovat dokonalou doménu, na které svůj nápad uskutečníte. Bude ale taková doména volná?

Přečtěte si náš článek Zajímavá fakta o doménových jménech.

Nedávno vydaný Internet Explorer 7 ovšem potřebné algoritmy již obsahuje, a tak se dostala otázka IDN opět na přetřes. V tuto chvíli již drtivá většina uživatelů dokáže tato doménová jména zpracovat.

Problémem ale zůstávají další aplikace. V GNU je možno použít knihovnu libidn, která provádí transformaci. Bohužel velká většina aplikací zatím nic podobného nepoužívá, takže si sice webové stránky na národní doméně prohlédnete, ale s dalšími službami můžete mít problémy. Pokud neprovedete převod na ASCII doménu jiným způsobem než přímo v cílovém software, ale to není moc pohodlné.

Nevýhody

V doméně .cz zatím není možno národní znaky použít a nevypadá to, že by se měla situace v nejbližší době změnit. Nevýhody jsou totiž poměrně závažné a plynou z meritu věci.

Ta hlavní plyne samozřejmě z chaosu, který zavedením IDN domén vzniká. Je adresa toho finančního serveru www.mesec.cz nebo www.měšec.cz? Problém ovšem nepostihuje jen uživatele, ale také provozovatele domén. Ti by měli po zavedení zaregistrovat všechny možnosti zápisu, protože by to mohl udělat někdo jiný a parazitovat na jejich dobré pověsti.

Další nevýhodou je také problém s přístupem na takto registrované domény z jiných zemí nebo z počítačů, které nemají nainstalovanou podporu příslušné znakové sady. Existuje například doména खोज.com. Pokud byste neměli tento odkaz, asi byste se na ni dostávali dost těžko. Představte si, že byste ji dostali třeba na vizitce od obchodního partnera.

CZ.NIC si nechalo před několika lety vypracovat průzkum mezi držiteli domén, který měl ukázat, jaký je o domény s českou diakritikou zájem. Protože se ale ukázalo, že 76 % z dotazovaných je proti, byly práce na zavedení podpory IDN zastaveny. Sdružení CZ.NIC ale poukázalo na to, že je připraveno v případě změny situace reagovat a podporu nasadit.

Bezpečnostní rizika

Další otazníky se vznášejí nad otázkou bezpečnosti. Je velmi snadné zaregistrovat si doménu, která obsahuje znaky podobné znakům v originální doméně. Jako příklad si můžeme uvést písmeno „a”. To je v Unicode zapsáno na více místech. Například malé „a” používané v cyrilice je jiný znak než malé „a” používané v latince.

Podívejte se, jak vypadají vedle sebe: а a

Ve zdrojovém kódu stránky (musíte ji uložit, Firefox například interpretuje znaky i ve zobrazení zdroje) se můžete přesvědčit, že se jedná o dva různé znaky. Na pohled jsou ale úplně stejné. To ovšem DNS nezajímá a může bez problémů zaregistrovat obě domény. Takových příkladů je samozřejmě možno najít více. To otevírá cestu různým phishingovým stránkám a dalším podvodům.

Takových podvodů už bylo předvedeno několik. Byly například zaregistrovány domény Microsoft.com nebo PayPal.com, které obsahovaly ruské znaky místo standardních. K oklamání uživatelů by to bohatě stačilo, kdyby se nejednalo o demonstraci možností IDN.

Opera a Mozilla zatím problém řeší blacklisty falešných stránek, ale definitivní řešení to určitě není.

ict ve školství 24

Závěrem

S příchodem nového Internet Exploreru jistě podstatně vzroste hlad po doménách s národními znaky. Je tedy docela možné, že se nakonec dostanou i do domény .cz. Otázkou zůstává, jak se vyvine otázka podpory v dalších aplikacích a především velmi důležitá otázka bezpečnosti.

Většina běžných uživatelů vidí IDN jako velmi zajímavou a pozitivní věc. Administrátoři a odborníci si pod pojmem IDN představí především řadu komplikací a zbytečných problémů. Co si myslíte vy?

Chcete domény s národními znaky?

Autor článku

Petr Krčmář pracuje jako šéfredaktor serveru Root.cz. Studoval počítače a média, takže je rozpolcen mezi dva obory. Snaží se dělat obojí, jak nejlépe umí.