Společnost OpenAI ve čtvrtek představila svůj jazykový model „Strawberry“ a tvrdí, že oproti předchozím velkým jazykovým modelům (LLM) výrazně zlepšila schopnosti, které nazývá „uvažováním“ a řešením problémů. Rodina modelů s formálním názvem „OpenAI o1“ bude zpočátku uvedena na trh ve dvou formách o1-preview a o1-mini, které jsou dnes k dispozici pro uživatele ChatGPT Plus a některých API.
Nové modely si problém rozkládají do několika kroků, které řeší postupně. Tyto modely jsme vycvičili tak, aby předtím, než začnou reagovat, strávily více času přemýšlením o problémech, podobně jako člověk. Díky tréninku se naučili zdokonalovat svůj proces myšlení, zkoušet různé strategie a rozpoznávat své chyby.
V testech si nový model vede podobně jako studenti doktorského studia v náročných srovnávacích úlohách z fyziky, chemie a biologie. Zjistili jsme také, že vyniká v matematice a programování.
V kvalifikační zkoušce pro Mezinárodní matematickou olympiádu (IMO) vyřešil GPT-4o správně pouze 13 % úloh, zatímco nový model dosáhl na 83 %.
Společnost OpenAI tvrdí, že o1-preview překonává svého předchůdce GPT-4o v mnoha srovnávacích testech, včetně programování, matematiky a „vědeckého uvažování“. Lidé, kteří model používají, však tvrdí, že zatím nepřekonává GPT-4o ve všech ukazatelích. Jiní uživatelé kritizují pomalejší odpovídání, které je způsobeno několikastupňovým zpracováním.