Nové „uvažující“ modely AI od OpenAI o1-preview a o1-mini

13. 9. 2024

Společnost OpenAI ve čtvrtek představila svůj jazykový model „Strawberry“ a tvrdí, že oproti předchozím velkým jazykovým modelům (LLM) výrazně zlepšila schopnosti, které nazývá „uvažováním“ a řešením problémů. Rodina modelů s formálním názvem „OpenAI o1“ bude zpočátku uvedena na trh ve dvou formách o1-preview a o1-mini, které jsou dnes k dispozici pro uživatele ChatGPT Plus a některých API.

Nové modely si problém rozkládají do několika kroků, které řeší postupně. Tyto modely jsme vycvičili tak, aby předtím, než začnou reagovat, strávily více času přemýšlením o problémech, podobně jako člověk. Díky tréninku se naučili zdokonalovat svůj proces myšlení, zkoušet různé strategie a rozpoznávat své chyby.

V testech si nový model vede podobně jako studenti doktorského studia v náročných srovnávacích úlohách z fyziky, chemie a biologie. Zjistili jsme také, že vyniká v matematice a programování. V kvalifikační zkoušce pro Mezinárodní matematickou olympiádu (IMO) vyřešil GPT-4o správně pouze 13 % úloh, zatímco nový model dosáhl na 83 %.

Společnost OpenAI tvrdí, že o1-preview překonává svého předchůdce GPT-4o v mnoha srovnávacích testech, včetně programování, matematiky a „vědeckého uvažování“. Lidé, kteří model používají, však tvrdí, že zatím nepřekonává GPT-4o ve všech ukazatelích. Jiní uživatelé kritizují pomalejší odpovídání, které je způsobeno několikastupňovým zpracováním.

Vstoupit do diskuse (18 názorů)

Zasílat nově přidané názory e-mailem

Našli jste v článku chybu?

Petr Krčmář

Petr Krčmář pracuje jako šéfredaktor serveru Root.cz. Studoval počítače a média, takže je rozpolcen mezi dva obory. Snaží se dělat obojí, jak nejlépe umí.

Témata:

ChatGPT

Sdílet

Autor zprávičky

Petr Krčmář

Témata:

Nové „uvažující“ modely AI od OpenAI o1-preview a o1-mini

Sdílet

Autor zprávičky

Petr Krčmář

Témata:

Dále u nás najdete

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

Vyzkoušeli jsme test, který ukazuje, co jsme zdědili po předcích

Nevyžádané marketingové hovory přísnější zákon nevymýtil

Sledují vás přes HDMI? Útok využívá elektromagnetické záření

„Nemáme na tom zájem“. Opozice brzdí TV poplatky

Vláda chce odložit účinnost "digitální ústavy" o dva roky

Bezplatný Microsoft PC Manager vylepšen

Nejen Coca-Cola, ale i Lidl má červený vánoční kamion

Přílišné uklízení škodí plicím stejně jako cigarety

Od pokeru do dílny: Vyrábí v ní nábytek z ohýbaného betonu

Vyznejte se v kuřatech. Takhle se liší selské od venkovského

Svařák bez alkoholu je skvělá varianta pro těhotné či abstinenty

V aplikaci Záchranka je rozcestník péče pro nevyléčitelně nemocné

Policie zatkla provozovatele tržiště pro DDoS útoky

První pacientka podstoupila genovou terapii bránící slepotě

Je možné vyhrát nad Temu? Prodejci her se to podařilo

Deepl nově umí překládat v reálném čase řeč

Stow vytváří regálové systémy pro Alzu, Lidl i Rohlík

Lumbální punkce sice vypadá děsivě, ale nebolí

Pokud potřebujete půjčit, nemusíte prodávat bitcoiny. Stačí je zastavit