Wikipedie: 10 let od článku "Hello world"

17. 1. 2011
Doba čtení: 8 minut

Sdílet

V sobotu, 15. ledna oslavila Wikipedie svoje 10. narozeniny. Po celém světě se konalo přes 200 akcí nejrůznějšího zaměření. V České republice to byl koncert a jeho záznam se stane součástí zvukových ukázek na české Wikipedii. My jsme využili výročí k tomu, abychom se o české Wikipedii dozvěděli něco víc.

Wikipedie slaví

Projekt Wikipedie je dnes největší encyklopedií na světě a okem běžného uživatele se může deset let její existence zdát jako velmi krátká doba na sesbírání tolika informací. Všichni jsme jí byli přímo či nepřímo ovlivněni, někteří z nás se třeba občas začtou do jejího obsahu v oblasti, na kterou se profesně ani nějak jinak nespecializují, jiní ji využívají pro studium do školy nebo i do práce. Wikipedie je o sdílení vědění mezi lidmi a je až s podivem, kam se za těch deset let dokázala dostat.

Tak schválně posuďte sami ze základních statistik pro českou a anglickou mutaci:

Údaj Angličtina Čeština
Počet stránek 3 530 566 184 119
Počet editací 438 498 755 6 379 158
Počet uživatelů 13 772 191 136 154
Počet aktivních uživatelů 127 687 2 162

Wikipedie se stala obrovským žijícím organizmem, který se přes všechny negativní předpoklady dokázal rozvinout do dnešní podoby. Dobře to vystihl wikipedista Gareth Owen slovy „Problém s Wikipedií je, že funguje jen v praxi. V teorii je to naprostá katastrofa.“ Málokterý projekt dokázal motivovat tolik lidí ke vzájemné spolupráci prakticky jen pro dobrý pocit. Celkově Wikpedii navštěvuje přes 400 milionů lidí, kteří prohlíží a editují 17 milionů článků ve 270 jazycích. Na první pohled to je docela nepředstavitelné množství informací.

O příběhu Wikipedie se rozepsal Vojtěch Bednář na našem sesterském serveru Lupa.cz.

Desáté narozeniny

Oslavy po celém světě se nesly v různém duchu a i v České republice jsme měli něco speciálního. V sále Farního sboru Českobratrské církve evangelické v Praze se konal koncert, kde zazněla díla od klasicismu až po českou hudební modernu skladatelů Antonína Stamice, Jana Jakuba Ryby, Bedřicha Smetany, Antonína Dvořáka a Leoše Janáčka. Jde o volná díla, jejichž ochrana majetkových práv vypršela a jelikož se podařilo získat svolení všech účinkujících interpretů, pořízená audionahrávka bude pod svobodnou licencí umístěna na projekt Wikimedia Commons a ukázky doplní související články na Wikipedii.

V zahraničí byl k vidění ať už fyzicky či virtuálně zakladatel Jimmy Wales, který si nemohl odpustit trochu nostalgie. Pro něj je toto výročí přece jen o něco větší než pro nás ostatní. Zde jsou jeho slova: „Je to těžké představit si, že je to už deset let, co jsem poprvé editoval Wikipedii. Pamatuji si na ten první den. Kliknul jsem na odkaz ‚Editovat‘ a napsal ‚Hello World‘ (‚Ahoj, světe‘). A to byl začátek Wikipedie a všeho, co potom následovalo. Chci poděkovat každému, kdo pomohl. Chci poděkovat všem lidem, kteří Wikipedii editovali, kdo přispěli k této skvělé sbírce znalostí. Chci poděkovat každému, kdo ji čte, kdo se skutečně zapojuje do sdílení myšlenek a vzdělání. Proto Wikipedii děláme: Děláme ji, aby ji lidé četli.“

Česká pobočka Wikipedie

Využili jsme desáté výročí Wikipedie a zeptali se představitelů její české pobočky, co vlastně dělají a co se jim od vzniku v roce 2002 podařilo udělat. Na první tři otázky nám odpověděl Jan Lochman, který do Wikipedie přispívá od října 2005 a později působil i na ostatních projektech Wikimedia včetně Wikiverzity, jejíž vznik v českém jazyce inicioval. Nový předseda sdružení Wikimedia Česká republika a člen Wikimedia Polska.

Jakou činnost si může uživatel představit pod názvem Wikimedia Česká republika? Staráte se jen o tu propagační a politickou stránku věci, nebo zajišťujete i nějaký obsah do české části Wikipedie?

Wikimedia Česká republika je občanské sdružení, které vzniklo za účelem pomoci projektům Wikimedia Foundation (Wikipedie, Wikislovník a další) a jejich propagace. Sdružuje ve svých řadách jak wikipedisty, tak i editory jiných projektů, kteří se mohou o sdružení při své činnosti „opřít“. Co se týče propagace, během roku se objevujeme na několika veletrzích a výstavách (Svět Knihy, LinuxExpo), vydáváme časopis Wikimedium, objevujeme se v médiích, publikujeme na blogu. V loňském roce vyšla první knížka o Wikipedii v češtině, kterou sepsali právě členové sdružení.

Vedle této propagační činnosti a autorskoprávní pomoci Wikipedistům vytváříme projekty zacílené na rozvoj Wikipedie. Ve spolupráci s partnery jsme spustili projekt nazvaný Ceny české Wikipedie. Jeho cílem je rozšířit editorskou základnu a zároveň zvýšit počet hesel na české Wikipedii. Další projekty se týkají vylepšování obsahu obrázky. Již třetím rokem zajišťujeme prostřednictvím našich sponzorů a peněz z nadace Wikimedia Foundation projekt Foto českých obcí. Jeho cílem je objet všechny obce a vesnice v České republice a připojit jejich fotografie k článkům nejenom na české Wikipedii. Dále půjčujeme kvalitní fotoaparát a scanner; v tomto roce bychom rádi k nabídce připojili kameru a zařadili nějaká školení nejenom ohledně kvality fotografií.

Na obsah Wikipedie máme jen takovýto zprostředkovaný vliv. Žádné regionální sdružení, které má status pobočky Wikimedia, nemá podle nadace Wikimedia Foundation přímo zasahovat do obsahu, stejně jako do něho nezasahuje ani nadace.

Máte statistiky o tom, kolik lidí do české Wikipedie za její existenci přispělo? Kolik napsal textu první z nich?

Kvůli principům Wikipedie jako wiki není možné generovat klasické statistiky. Na Wikipedii je založeno více než 135 tisíc uživatelských účtů, z některých ale nikdy nikdo do článků nepřispěl, nebo si účet založil jen proto, aby Wikipedii uškodil vandalismem. Také je možné, že jeden člověk disponuje více účty. Nebo třeba udělal jen jednu dvě editace a už se nevrátil. Na druhé straně mnoho práce udělali anonymní editoři bez registrace. Jinak aktivních editorů uvádějí statistiky dva tisíce, těch, co editují pravidelně skoro každý den, může být tak odhadem kolem osmdesáti.

Prvním wikipedistou registrovaným na české Wikipedii byl esperantista Miroslav Malovec, který přeložil hlavní stránku do češtiny. I když se v současnosti někdy vrátí na českou Wikipedii, ve středu jeho zájmu stojí esperantská Wikipedie. Pro zajímavost na počet bajtů nejvíc textu vložil do české Wikipedie jiný editor, který se významně zapsal do jejích dějin – jde totiž o známou osobnost. Mluvím o Antonínu Vítkovi, významném českém popularizátoru kosmonautiky.

Jaké jsou vaše největší úspěchy od roku 2002?

Česká Wikipedie se od té doby stala největší původní internetovou encyklopedií v češtině a právě v tuto dobu dohání i nejoptimistič­tější odhady velikosti největší české encyklopedie všech dob – Ottova slovníku naučného. Každý měsíc si na české Wikipedii uživatelé otevřou na 30 milionů stránek. Pro všechny je k dispozici zdarma a všem přináší informace o tom, co lidi na internetu zajímá a co na něm hledají. V posledních několika letech se naše úsilí zaměřuje mnohem víc na kvalitu. Snažíme se, aby články obsahovaly odkazy na zdroje uvedených informací, protože právě tak si může Wikipedie získat větší důvěru uživatelů. Správnou cestu nám v tom ukázala německá Wikipedie, která se těší výborné pověsti.

Technické zázemí Wikipedie

Další otázky jsou směrovány na technickou stránku Wikipedie, která nás na Rootu bude určitě zajímat víc. Na všechny nám odpověděl Danny B. Ten do projektů Wikimedia přispívá od prosince 2005, od ledna 2006 pak i k vývoji MediaWiki. Je členem sdružení Wikimedia Česká republika a iniciátorem jeho založení.

Na jakém operačním systému Wikipedie běží? Došlo v minulosti k nějaké zajímavé softwarové změně, nebo se Wikipedie drží pořád toho samého?

Servery Wikimedia běží primárně na Ubuntu. Dříve jsme měli také nějaké další distribuce (RedHat 9 a Fedora Core 2–4), ale ve IV. kvartálu 2006 vznikla potřeba sjednocení na jediné. Vlastní proces sjednocování ze zřejmých důvodů (řada z vyměňovaných systémů byla na strojích sloužících k vlastnímu generování stránek) pak trval nějakou dobu. Momentálně máme všechno na Ubuntu, až na servery pro ukládání médií, které běží na Solarisu.

Máme i vlastní package pro core software jako PHP nebo MySQL.

Na kolika serverech se Wikipedie rozkládá? Využíváte i poskytovatele cloudových řešení? Máte servery na jednom místě, nebo v několika serverovnách po světě?

Wikimedia Foundation provozuje přibližně 400 serverů, žádný hosting neoutsourcuje. Primární datacentrum je v Tampě na Floridě, v Amsterdamu je pak kešovací centrum. V Nizozemsku je také peeringové spojení.

MediaWiki je napsané v PHP a využívá databázi MySQL. Jakým způsobem řešíte škálovatelnost? Je problém přidat nový server, který rozšíří kapacitu těch ostatních?

MediaWiki je naprogramována tak, aby mohla maximálně využívat škálovatelnost, kterou jí Wikimedia poskytuje.

Používáme skupiny služeb na serverech, které jsou pro tyto role nastaveny. Máme tak cachovací servery (Squidy a Varnishe), Apache, Memcached, MySQL a další specializované stroje. Používáme modifikovanou verzi Squidu jako reverzní proxy před PHP. Cluster se Squidy vyřizuje nejvíce požadavků – těch, které přicházejí od nepřihlášených uživatelů, což značně redukuje zátěž na PHP backend.

Většinu potřeb škálovatelnosti řešíme rozšiřováním počtu serverů v daném clusteru a rovněž pravidelnou výměnou hardware vzhledem ke klesající křivce jeho výkonnosti. Navyšování našich kapacit vyžaduje plánování, ale naše infrastruktura byla navržena s vědomím potřeby rozšiřování, takže vlastní proces navýšení je pak zpravidla hladký a rychlý.

Rozšiřování PHP backendu do současné velikosti zhruba 140 osmijádrových serverů bylo velmi jednoduché a zrovna tak je jednoduché přidat další. Rozšiřování MySQL bylo o něco méně jednoduché, ale námi používané techniky jsou poměrně běžné.

Architektura našeho úložiště médií není nějak konkrétně škálovatelná, v podstatě máme všechna média na jednom velkém serveru pouze s replikací kvůli zálohám. Toto je hlavní oblast, v níž očekáváme nutnost dalšího vývoje software směrem k lepší škálovatelnosti.

Servery Wikipedie

Používá Wikipedie MediaWiki tak, jak je předkládána na jejím webu, nebo obsahuje i nějaký uzavřený kód?

Wikimedia cluster, na němž běží Wikipedie a její sesterské projekty, používá jen open source řešení. Jedinou výjimkou jsou výše zmiňované Solarisy, které ale rovněž čeká nahrazení některou opensourcovou alternativou.

Přesná verze MediaWiki, kterou používá Wikipedie, je veřejně dostupná a je velmi podobná standardní distribuci MediaWiki stažitelné z mediawiki.org. Nepoužíváme žádný uzavřený kód, vše je (samozřejmě až na bezpečnostní opatření, jako je ochrana hesel apod.) dostupné.

bitcoin školení listopad 24

Závěr

Wikipedie stojí na lidech, kteří jsou ochotni věnovat trochu svého času a sdílet část svého vědění s ostatními. Čím víc wikipedistů se připojí, tím lepší bude celá Wikipedie. Nebojte se proto na Wikipedii opravovat chyby, doplňovat informace a nebo psát rovnou nové obsahové stránky.

Nakonec bych rád poděkoval Miroslavu Langerovi, který byl velmi nápomocen při shánění informací do toho článku. Děkuji.

Autor článku

Adam Štrauch je redaktorem serveru Root.cz a svobodný software nasazuje jak na desktopech tak i na routerech a serverech. Ve svém volném čase se stará o komunitní síť, ve které je již přes 100 členů.