Hlavní navigace

Autoři e-knih se obávají umělé inteligence

28. 6. 2024

Sdílet

Čtečka eknih knihovna Kindle Autor: Depositphotos

U nové e-knihy českého autora se mi nečekaně na jedné z prvních stránek zobrazilo:

Automatizovaná analýza textů nebo dat ve smyslu čl. 4 směrnice 2019/790/EU je bez souhlasu nositele práv zakázána.

Ještě nedávno jsem si ničeho takového nevšiml. Autoři e-knih se oprávněně obávají umělé inteligence, která by se mohla na jejich dílech zdarma trénovat.

Loni se často objevoval problém s anglickým datasetem pro AI s názvem Books3, měl 100 GB a obsahoval téměř 200 tisíc e-knih vydaných v posledních letech. Šlo o známé autory jako Stephen King, Margaret Atwoodová a Zadie Smith. Celý seznam ISN je na GitHubu. Problémem ovšem bylo, že knihy byly získány pirátsky, bez jakéhokoli souhlasu vydavatelů či autorů. Dataset Books3 byl součástí velkého datasetu the Pile (800 GB), který vytvořil v roce 2020 Shawn Presser.

Tento dataset použila k trénování AI například Meta (Llama-2), Bloomberg, EleutherAI a NVIDIA (NeMo). V současnosti probíhají soudní spory.

Autor: J. Fikar
Našli jste v článku chybu?

Byl pro vás článek přínosný?

Autor zprávičky

První linux nainstaloval kolem roku 1994 a u něj zůstal. Později vystudoval fyziku a získal doktorát.