Skype používá interlingual machine translation. Bing Translator i Google Translate používají statistical machine-translation.
Podpora češtiny v Bing Translatoru i Google Translate je tragická. Pokud jde o překlad mezi angličtinou a němčinou/francouzštinou/španělštinou, je výsledek výrazně lepší, a oba překladače mají svoje silná i slabá místa. Například u španělštiny Google Translate pravidelně mrší zápory, a Bing Translator je zvládá daleko lépe. Řadu obratů naopak Bing přeloží doslovně, a Google je přeloží správně.
U Bing Translatoru potěší možnost překladu čínštiny z kamery, ale u obou služeb jsou překlady čínštiny i thajštiny snad ještě horší, než u slovanských jazyků. S ostatními jazyky nemám tolik zkušeností.
Hypoteticka otazka - je mozne vobec spravit strojovy preklad ktory bude "bezchybny" na takej urovni ako keby to prekladal clovek/prekladatel ?
Teraz myslim s konecnym vypoctovym vykonom nejakeho bezneho desktopoveho/notebookoveho PC. Iste nejaky nechutny cluster co bezi na Sriri v Apply by to asi aj zvladol ale to je uz ina liga.
Určitě to nebude překládat aplikace, ale rovnou sledovací systém na serverech Microsoftu. NSA potřebuje mít realtime přehled o tom, co kdo přes skype kecá, tak zabijou dvě mouchy jednou ranou, překlady, které by měli poskytovat NSA budou posílat realtime na druhou stranu. Skype už není p2p, ale služba s centrálními servery.
NSA většinu z toho dělá pro miliony "uživatelů".
Záleží na úrovni překladu. Pokud jde o překlad "příjemce rozumět co já teď říkat" tak zcela jistě. :-)
Je to záležitost algoritmu a velkých slovníků. Pokud se na server pošle dostatečně velký vzorek hlasu a tam zpracuje, aby se program naučil rozumět uživateli, může to potom fungovat i lokálně. Běžný rozhovor tak složitý není. Při současném výpočetním výkonu bych očekával úroveň lepší než u některých tlumočníků na zájezdech.
UI schopnou překladu nerozeznatelného od rodilého mluvčího nemáme a přiznejme si, ani nepotřebujeme. Na tlachání na úrovni puberťaček už vůbec ne. Nemuset obcházet patenty a podobnou verbež, už tu velmi schopné překladače máme. Zde máme teorii, algoritmy i podklady zmáknuté a brzdí to jen právníci a managoři.
Když vezmeš, že potřebuješ pouze jeden slovník, rodný do strojového pseudojazyka. A ani jeden nemusí být extrémě rozsáhlý (včetně frází).
Pokud jde o rozpoznávání, tam je situace podobná. Přiřadit vyslovené slovo ke strojovému pseudovýrazu. Naučit se "hlas svého pána" je pro jednotlivce otravné. Když máš však k dispozici několikahodinový vzorek kecání na Scype a porovnáš přiřazenými slovy ostatních, dostaneš dvojice, sada hlasových markerů=slovo, vcelku jednoduše.
Překlad není deterministický, takže nemá smysl uvažovat o bezchybnosti. Co se porovnání s kvalitou překladatele lidského týká, tak ta je ve srovnání s průměrným člověkem na přijatelné úrovni. Profesionální překladatel to sice zvládne lépe, ale vaši recepční a její tlumočení ten automat hravě strčí do kapsy. Tedy za předpokladu, že se bavíme o dvou dobře podporovaných jazycích, jako je němčina a angličtina. Na češtinu si ještě musíme počkat.
On ten nápad není tak špatný. Zvlášť pokud klient převede hlas na text a druhý klient text na hlas, tak sítí běží text a množství dat je minimální.
Možnost přijmout telefonát v textu a ještě přeložený také není k zahození.
Při umělém hlasu by bylo možné použít hodně silné šifrování i ve stejném jazyce při minimálních datech a složitosti.
Neobávám se, že zrovna tohle by umožňoval MS-NSAkype.
Je jasné, že real time překlad není možný. Větu můžu přeložit až po tom co ji dokončím celou. Už třeba jen kvůli jinému slovosledu v různých jazycích.
A na videu chlápek ještě nedořekne větu a už je přeložená na displayi? Tomu někdo věří? Jeslti se algoritmus dívá do věštící koule, přes kterou vidí do budoucnosti, co člověk řekne, tak pak bych taky věřil, jinak ne.