Meta včera představila open-source AudioCraft s licencí MIT. Jde o generativní AI pro hudbu a audio z textového zadání. AudoCraft se skládá ze tří částí: MusicGen, AudioGen a EnCodec. MusicGen byl trénován na hudbě, kterou vlastní Meta a AudioGen na veřejných zvukových efektech.
EnCodec používá AI k lepší kompresi audia s menším množstvím artefaktů. Více detailů se dozvíte v blogu, případně v odkazech na články na konci blogu. Zdrojové kódy jsou na GitHubu.
(zdroj: slashdot, arstechnica)