Apple představil malé jazykové modely, vhodné do telefonu

26. 4. 2024

Sdílet

umělá inteligence Autor: Depositphotos

Velké jazykové modely (LLM) s malým počtem parametrů jsou vhodné jako umělá inteligence přímo v mobilním telefonu, bez nutnosti komunikovat se serverem. Společnost Apple představila OpenELM (Open-source Efficient Language Models). Je zde sice open-source, ale licence Apple Sample Code nejde úplně označit jako open-source licence. Nicméně zdrojové kódy jsou k dispozici.

OpenELM je natrénováno s 270 milióny až 3 miliardami parametrů na veřejně dostupných zdrojích.

V současnosti největší dostupný LLM je Llama 3 od Meta se 70 miliardami parametrů. GPT-3 z roku 2020 pak měl 175 miliard parametrů. V článku Apple ukazuje, že jejich OpenELM s 1 miliardou parametrů dává lepší výsledky než konkurenční modely stejné velikosti. Předpokládá se, že OpenELM uvidíme v červnové aktualizaci iOS 18.

(zdroj: arstechnica)

Našli jste v článku chybu?

Autor zprávičky

První linux nainstaloval kolem roku 1994 a u něj zůstal. Později vystudoval fyziku a získal doktorát.