To mne právě celkem mrzí, že když už lidé mají potřebu psát o kauze TrueCryptu spekulace a články (netýká se jen Root), nikdo z nich neuvedl důvody které vedly běžné webové archivační služby a cache k tomu, že obsah původního webu (v čase kdy ještě existoval) je nedostupný. Tady bych já osobně začal dotazy a rozjel pátrání.
Já (dnes) pochopitelně nevím jaký obsah byl kdy v minulosti pomocí robota webu TrueCrypt vyloučen. Obecně bych předpokládal, že fórum a binárky byly vyloučeny vždy, ale ten zbytek...
Internetový archív WayBack Machine (archive.org) oznamuje že požadovaná URL již byla vyloučena z WayBack Macine (has been ecluded). Neoznamuje, že tento obsah nebyl nikdy archivován. Nicméně důvodem může být klidně to že web (část kterou bylo možné archivovat, to co zmíněný robots.txt povolil) se po dobu několika let nezměnil, nebo obsah nebyl zajímavý (o to co bylo archivováno nebyl zájem). Právě proto měl autor článku položit této a podobným službám dotaz.
Například web Adobe.com v archívu je obsažen a jsem si jistý že také nebude zkopírováno vše. Z webu Microsoftu uvidíte jen torzo, protože většinu věcí je právě zakázáno kopírovat, nebo je možná na jiných doménách (ale pochybuji že by to kopírovali tak prasácky).
U vymyšlené neexistující adresy bude napsáno: Hrm (asi naše hmm), WayBack Machine nemá takovou stránku archivovánu. Takže opravdu nevěřím, že v jejich archívu web TrueCrypt.org nikdy nebyl.
Schválně si ještě počkejme, až někdo kdo robots.txt ignoruje a udělal si vlastní kopii zveřejní obsah historického souboru robots.txt.
Svádět dnes vše na tento soubor je velmi podivné, kolikrát při prohledávání Internetu naleznete v různých cache obsah který neměl být v cache umístěn... přinejmenším to vypovídá o tom, že vyhledávače určitý obsah nezobrazují. Schválně sledujte (já už klasické vyhledavače příliš nepoužívám) zda budou nabízet odkazy na nové zdroje starých binárních souborů které během posledních dní vznikly nebo zda se bude dít že to co dnes našli zítra již nenajdou. Dlouho jim to podle mne nevydrží a časem rezignují, nebo by ten balík peněz (či výhrůžek) musel být opravdu dostatčně velký.
Podle mne se na WayBack Machine zobrazují jiné hlášky pro adresy, které vůbec nezná, a jiné pro adresy, které sice zná, ale kvůli robots.txt z nich nearchivuje žádný obsah.
Z webu TC nemuselo být archivováno vůbec nic, protože autoři mohli zastávat zásadu "jediné důvěryhodné informace o TC jsou na našem webu, nikde jinde by neměly být žádné kopie, které budou zastarávat".
To je pochopitelně také možné. Nehodlám stanovy a stavové hlášky archive.org studovat (jsou-li vůbec v dostatečném rozsahu k dispozici). Proto měl autor právě požádat o vyjádření.
P.S.
Pokud znáte nějaký web který je pomocí robots.txt blokován kompletně a je již nějakou dobu (na to aby o něj archív projevil zájem) veřejný, klidně nám ho oznamte, ať můžeme zjistit jakou hlášku archív vypustí. Já na žádný (na který bych chtěl zrovna upozornit) nemohu přijít, věřím ale že jich bude dostatečné množství (a většinou o nich ani nevím).
Jinak, ten historický obsah robots.txt nám může sdělit i ten kdo ho ctí. Předpokládám, že minimálně onen robots.txt by se z webu zkopíroval.
Nevím to ale jistě. Já používám většinou WGet a na tak strikní omezení, že by nemělo být kopírováno nic jsem ještě za život nenarazil nenarazil. U některých webů to ovšem vůbec nesleduji, ale i tam jsem většinou narazil na to že byla zkopírována pouze nějaká část a musel vše řešit až dodatečně.
Z FAQ: Siteowners might have also requested that their sites be excluded from the Wayback Machine. When this has occurred, you will see a "blocked site error" message. When a site is excluded because of robots.txt you will see a "robots.txt query exclusion error" message.
Pro truecrypt.org hlásí WBM tu první hlášku, tedy vyřazení na žádost vlastníka stránky. truecrypt.com v archivu je.
Jestli ten popis potřebujete z nějakých důvodů, nebo cokoli jiného...
Nevím jak v archívu pro MacOS X či Linux, ale v archívu pro Windows (který má a měl volbu "jen extrahovat") je soubor "TrueCrypt User Guide.pdf" (923 969 B, SHA-256: 739d7a00489395f516239a506f2e0b614052401cd9f692b4f8cde0cbf55b3c0a), ve kterém jsou ty stejné informace a technické údaje které byly uvedeny na webu.
Bezpečný archív "TrueCrypt Setup 7.1a.exe" (SHA-256:e95eca399dfe95500c4de569efc4cc77b75e2b66a864d467df37733ec06a0ff2) můžete staáhnout zde http://truecrypt.ch/download/current/TrueCrypt%20Setup%207.1a.exe
A vůbec, tohle je to co je uvnitř instalátoru, co získáte po extrakci:
f6994309a1f883b434dcd5b814476da7bb6628762073e6d487c05610e80329c5 ?SHA256*License.txt
4e32f3d2aecbbb202e13738f5465e83bb5f21b05e587d7bbe811c8019116bb77 ?SHA256*TrueCrypt Format.exe
739d7a00489395f516239a506f2e0b614052401cd9f692b4f8cde0cbf55b3c0a ?SHA256*TrueCrypt User Guide.pdf
46aecc5160f04fc3ffe4d37b404ccbbd1c5dc1501c2ceee8284ff544dbdf10f8 ?SHA256*truecrypt-x64.sys
7f4e7ac770928e9d313b7e91db4b904a98f3d8bbac3e0b88fbca9ef15dd6ed71 ?SHA256*TrueCrypt.exe
07bd324083d1784f8f716c528d530003369e6d87efc7b79bcaa1767f80da4fdc ?SHA256*truecrypt.sys
P.S.
Schválně si povšimněte, že TrueCrypt používal vlastní licenci a nebyl licencován jako Open Source, jak mnozí tvrdí.