Může mi hlavně vysvětlit někdo to, že AI (Jazykový model, AI neexistuje, zatím) se na tom naučit nebo inspirovat nemůže, ale člověk ano?
Já bych chtěl rád vidět, kolik děl je naprosto, ale naprosto originálních, kde autor ani jednou nekouknul do jiného, či se neinspiroval.
Jako sorry, napsat stejnou věc, myšlenku, koncept jinými slovy nepovažuju, že to je "něco jiného". Asi blbý příklad, ale v tomto hicu se nemůžu na nic jiného.
10 + X = 20
10 + Y = 20
V obou případech jde o rovnici. V obou případech je řešení stejné - rovno 10, ale jen proto, že tam je jiné písmenko, tak je budeme považovat za rozdíle? To je hloupost.
Ok, fajn mohu napsat
10 + X = 20
10 + H = 12
Trošku jsem to změnil, myšlenka, koncept je pořád stejný. Klidně můžeme říct, že to je něco jiného, ale (teď omluvte můj zoomer moment), na toto se hodí meme "Well yes, but actually no".
Ten problém je v masovosti a hromadnosti.
Ten člověk, aby vytvořil inspirované dílo, musí prvně původní díla načíst, věnovat nemálo sil na to, aby to pak sepsal, aby to nebylo čisté copy/paste, aby to bylo lepší než originál atd. AI v principu sežere úplně vše co má na dosah během "chvilky" a pak chrlí odvozená díla ve velkém, takže tam pomyslný jazýček vah, co je ještě ve prospěch celku versus kde by měla končit ochrana práv autora je tam úplně někde jinde.
Něco podobného jako u soukromí a sběru dat. Nevadí mi, když mě vrátný pokaždé pozná a pozdraví, když mě Vietnamec zná jménem atd. Protože sice jsou to osobní údaje, ale zůstanou v jejich hlavě. Sice se jich někdo může zeptat, ale je to velmi výjímečné a náročné. Zato mě hodně vadí kamery se záznamem a ještě víc face recognition - protože ty z náhodného sběru střípků udělaji rutinní sběr zneužitelných a zneužívaných dat.
V tom případě bych to řekl takto. Pokud model generuje celé věty, odstavce textů slovo od slova stejné, pak je to špatně. Jedná se o kopii, ukradení díla (pokud licence nepovoluje dílo k volnému užití).
Pokud model generuje přeformulovaný obsah a jen zanechává původní myšlenku, znění, je to v pořádku. To se do teď dělo a bylo to v pořádku, nikomu to nevadilo.
Však kolik médii otiskne stejnou zprávu a nesoudí se, že oni toto napsali první.
Kolik existuje písniček se stejným tématem, kolik přezpívaných, parodií, remixů a já nevím, jaký různých variant. To se můžeme vzájemně začít do nekonečna soudit až do konce soudného dne.
Což ale povede jen k tomu, že ve velmi omezeném čase (jednotky let odhadem) jakékoli umění prostě přestane existovat úplně, vše co bude kdo chtít v nejhorším případě může znamenat koupit licenci k modelu a trochu elektriky, pro nás piráty-geeky žádná licence a hodně elektriky.
Chceme to? (to je vážně míněná otázka, a nejsem si úplně jist, jak bych na ní odpověděl - zvláště po několika posledních událostech (třeba kdy je za umění placené z eráru označováno i vystrkování tlustého pozadí a házení hlíny po kolemjdoucích mám trochu tendenci i souhlasit))
Což ale povede jen k tomu, že ve velmi omezeném čase (jednotky let odhadem) jakékoli umění prostě přestane existovat úplně
Proč? Nic z toho, co se děje nebo dělo nemá na umění vliv. I přes to, že existují mnohem lepší metody "nanášení barvy na papír", tak stále někdo vezme do ruky tužku a něco pěkného nakreslí.
O hudbě ani nemluvě. Odjakživa se hraje na všechno, co nějak zní a to, že dneska lze mít v pc dost slušný generátor vůbec neznamená, že někdo nevezme trubku od hajzlu a neudělá z toho hudební nástroj. Už jsem viděl i kapelu, která hraje na telefonní ústřednu.
No právě, nesouhlasím tím, že plně souhlasím. Vezměte si tu muziku. Jasně, na místní kapelu chodím, protože si poslechneme muziku a pak s klukama pochlastáme, tady žádné riziko ze strany AI nehrozí. Nedá mi to nezmínit, že ti kluci když večer nehrajou, tak choděj makat do fabriky, aby měli z čeho žít, to pade až kilo per capita na vystoupení je zrovna neuživí.
Pak jsou tu velké fesťáky, které jsou taky důležité, ale taky známější kapelu samy o sobě neuživí, většina je z prodeje CD, streamování apod.
No a jsme u toho. Už dnešní AI jsou lepší než člověk třeba v manipulaci. Jakmile budou k dispozici pokročilejší generativní neuronky, tak můžete použít to samé klidně i k generování muziky (a ostatně i filmů) na míru. A vyjde to levnějš, a běžný posluchač/divák bude mnohem spokojenější, a sekundárně to uřízne zdroj peněz, díky kterému ty velké kapely vznikají.
Nebo si vezměte filmy - osobně se nedívám na nové +- od doby, kdy se kvalita efektů dostala do popředí před dějem (o současné kolonizaci filmů woke nesmysly nemluvě). Ale možnost se kouknout na film podle mnou vybrané předlohy, s personalizovaným obsazením, prostředím, vyzněním filmu etc. mi připadá jako velmi lákavá, teda ve chvíli, kdy ten film bude vypadat realisticky.
Vůbec nemluvím o pornu ;-) když si do rovnice s AI doplníte úspěch OF, kdy lidi platěj už teď nezanedbatelné peníze holkám za to, že dělají podle jejich requestů...
30. 6. 2024, 13:10 editováno autorem komentáře
Ten člověk, aby vytvořil inspirované dílo, musí prvně původní díla načíst, věnovat nemálo sil na to, aby to pak sepsal, aby to nebylo čisté copy/paste, aby to bylo lepší než originál atd.
Aniž bych tohle chtěl nějak rozporovat, tak napíšu, co jsem chtěl napsat už ráno (ale počkal jsem si na diskusi).
V devadesátkách, to mi bylo tak 12-15, jsem četl časopisy a v nich recenze jistých blíže nespecifikovaných zařízení. Po přečtení už asi jen 20 recenzí jsem měl neodbytný pocit, že to píše generátor. Vlastně jsem přemýšlel, jak těžké by bylo nějaký takový napsat. Ono by stačilo si napsat pár generických odstavců, do toho automaticky vložit název zařízení a generátor je na světě (náhodně vybírat odstavce na danou pozici v textu a do nich vkládat případně jméno zařízení a další údaje - samozřejmě postupně pomalinku dodávat další generické odstavce, ať ten systém má z čeho vybírat). Dodnes nevím, jestli to tak tehdy generovali, nebo to takto divně prošlo přes předkladatele (který možná nevěděl, o čem píše) apod.
Co tím chci říct. Spousta textů je vlastně jen šablona. Veškeré sci-fi filmy z 80 lze popsat jako: "Objevili jsme tajemný úkaz, poletíme to prozkoumat. A něco se stane. Někdy se ukáže, že ten úkaz vlastně byl někým podstrčený, někdy je to skutečně záhadné, ale už o tom někdo věděl a proto nás tam poslal."
Právě jsem popsal plot alienů, predátora, dooma, half-life apod. Mě osobně se námět "tajemný experiment se nepovede" vlastně docela líbí. Na stotisící film daného tématu se vlastně rád podívám. Ale nevydávám to za originalitu.
Současná AI je v podstatě generátor vět na základě statistiky. Řada 1 2 3 4 5 i 1 3 5 2 4 2 bude mít stejný medián, průměr i rozptyl. Dokonce i řada 5 1 3. S tím se až tak moc kouzlit nedá. Co nemá propojeno v databázi, to si sama nepropojí.
Další věc je kreativita, AI nezná smysl z význam slov. Neví, co popisuje. Má mechanicky naučeno, že když řádek začíná if(
, tak má končit ) {
a nerozumí proč. Zákonitě pojede podle šablony.
Pak je problém s kontextem. Když zjistí, že za "čistý zisk" je nějaký číslo v procentech, pleskne tam číslo v procentech. S nějakou pravděpodobností podle toho, jak se čísla v trénovacích datech opakují. Takže se nemusí jednat zrovna o fakta.
Pak je někde problém i s citací. Můžu třeba v odborné práci převzít část cizího textu, ale měl bych chápat, o čem autor píše a mel bych ho dát do zdrojů. U AI netuším, odkud to vybleje a nevím, jestli smíchala dvě seriózní studie, nebo tři ezo bláboly. Ale chápu, že u beletrie to asi nebude tak horký,... A pokud jde o historicku literaturu, víc jak Vondruška asi neuletí.
Takže tam to bude spíš o kvantitě, než o kvalitě
Tady ale narážíte na problém srovnatelný s p-zombií (a částečně Turingovým testem).
To co píšete je hezké, nicméně pokud Vám někdo neřekne, že něco generovala AI a Vy nemáte background, jak to funguje, tak jste (velmi brzy budete) namydlený. Smyslem je, že z výstupu samotného (brzy) nedokážete rozeznat, jestli ta AI chápe text, nebo "jen" generuje podle nějakého algoritmu text, který je nerozeznatelný od toho, který chápe.
Navíc, okno, jak AI nachytat se s vývojem povážlivě zmenšuje a obvykle potřebujete dost specifickou konverzaci, abyste měl jistotu. U uměleckého díla nemáte ani kontrolu nad promptem.
Tebou uvedené řady mají (postupně podle uvedení) tyto hodnoty:
průměr: 3, 2.8, 3
rozptyl: 2.5, 2.1667, 4
median: 3, 2.5, 3
Takže nechápu, co má se kterou, co stejného.
Zvláštní, ChatGPT mi na otázku "Chápeš důvod, proč se používá něco jako `if ( ... ) {` celkem hezky vysvětlil smysl syntaxe v programovacích jazycích. Co se mu děje v hlavně neutším, stejně jako netuším, jestli bys mi to dokázal vysvětlit lépe, a jestli tomu rozumíš....
Na tom "čistém zisku" není nic špatného Když ses učil barvy, tak tě taky za správně určenou zelené pochválili, ne?
"V devadesátkách, to mi bylo tak 12-15, jsem četl časopisy a v nich recenze jistých blíže nespecifikovaných zařízení. Po přečtení už asi jen 20 recenzí jsem měl neodbytný pocit, že to píše generátor."
To chce Occamovu břítvu - není důvod nepreferovat nejjednodušší vysvětlení. V daném případě autoři recenzí pravděpodobně opisovali z jednoho (původního) zdroje. Tenkrát ještě zdaleka nebyl přístup k informcím tak snadný jako je dnes. No a dělat dobrou recenzi chce znalosti a čas - kde by ty časopisy vzaly lidi?