Databricks je americká firma, založená v roce 2013 vývojáři Apache Spark. Ve středu vydali velký jazykový model (LLM) Dolly 2.0. Ten má 12 miliard parametrů a je open-source pod licencí Apace 2.0. Velká pozornost byla věnována datům, ze kterých se AI učí. Díky tomu je možné Dolly 2.0 použít komerčně, což většina ostatních LLM zdarma nedovoluje.
Dolly je založena na modelu Pythia od EurelAI a k tomu byla natrénována na 15 tisíc ručně sestavených vstupů a výstupů. Na jejich tvorbě týden pracovalo 5 tisíc zaměstnanců Databricks. Díky tomuto natrénování může Dolly lépe vést dialog a odpovídat na dotazy. Zdrojové kódy i datasety jsou na GitHubu.
(zdroj: arstechnica)