Velké jazykové modely (LLM) s malým počtem parametrů jsou vhodné jako umělá inteligence přímo v mobilním telefonu, bez nutnosti komunikovat se serverem. Společnost Apple představila OpenELM (Open-source Efficient Language Models). Je zde sice open-source, ale licence Apple Sample Code nejde úplně označit jako open-source licence. Nicméně zdrojové kódy jsou k dispozici.
OpenELM je natrénováno s 270 milióny až 3 miliardami parametrů na veřejně dostupných zdrojích.
V současnosti největší dostupný LLM je Llama 3 od Meta se 70 miliardami parametrů. GPT-3 z roku 2020 pak měl 175 miliard parametrů. V článku Apple ukazuje, že jejich OpenELM s 1 miliardou parametrů dává lepší výsledky než konkurenční modely stejné velikosti. Předpokládá se, že OpenELM uvidíme v červnové aktualizaci iOS 18.
(zdroj: arstechnica)