ChatGPT časem odpovídá jinak

21. 7. 2023

Výzkumníci ze Stanfordu Berkeley zkoumali odpovědi na sérii stejných otázek GPT-3.5 a GPT-4 v březnu a v červnu letošního roku. Výsledky se mezi březnem a červnem překvapivě hodně měnily. Například na otázku, jestli je 17077 prvočíslo (je), odpovídalo GPT-4 v březnu s 98% úspěšností, ale v červnu jen s 2%. Naopak tomu bylo s GPT-3.5. V březnu úspěšnost 7 %, ale v červnu 87 %.

Výzkumníci v závěru varují, že LLM (large language model) v průběhu času velmi mění odpovědi a bylo by dobré kvalitu odpovědí systematicky sledovat. Výsledky jsou dostupné na GitHubu. Více detailů naleznete v článku [PDF].

(zdroj: slashdot)

Autor: Lingjiao Chen, Matei Zaharia, James Zou

Vstoupit do diskuse (31 názorů)

Zasílat nově přidané názory e-mailem

Našli jste v článku chybu?

Jan Fikar

První linux nainstaloval kolem roku 1994 a u něj zůstal. Později vystudoval fyziku a získal doktorát.

Sdílet

Autor zprávičky

Jan Fikar

ChatGPT časem odpovídá jinak

Sdílet

Autor zprávičky

Jan Fikar

Dále u nás najdete

Kartička pojištěnce v mobilu. VZP má tuto funkci jako téměř poslední zdravotní pojišťovna

Notebook Asus ExpertBook P5: Pracant s výborným displejem

AI systémy, které v Česku zřejmě nikdy neuvidíte

Největší IT hrozba? Zdánlivě neškodný internetový prohlížeč…

Placené Mapy.cz jsou tady

„Nemáme na tom zájem“. Opozice brzdí TV poplatky

V obchodech je máslo s obsahem tuku jen 61 %. Rarita, ale povolená

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

Klienti VZP nemusí nosit plastovou kartu, mohou mít elektronickou

Zpravodajství ČT chystá nové pořady

Stát by měl zavést minimální ceny za jednotku alkoholu

Kdy se OSVČ vyhne platbě sociálního pojištění?

Evropská peněženka digitální identity bude revoluční

Identita občana se přesunula na gov.cz

Vánoční slevy operátorů? Daleko za očekáváním

Co máte v uších? Chytré audio se veze na úspěšné vlně

Kyberbezpečnost bude nákladná. Proč NÚKIB tvrdí opak?

Ředitel Intelu odstoupil po nejhorším období za 40 let

Vzrostou limity u dohod i zaměstnaneckých benefitů

Stojíme na rozcestí, kde jde o víc než o procenta emisních cílů