OpenAI proveo istraživanje: ChatGPT postaje sve pametniji i sve više izmišlja

Najnoviji vodeći modeli OpenAI-a, GPT o3 i o4-mini, namijenjeni su oponašanju ljudske logike. Za razliku od prethodnika, koji su se uglavnom fokusirali na generiranje tečnog teksta, OpenAI je izgradio GPT o3 i o4-mini kako bi stvari promišljali korak po korak.

OpenAI se pohvalio kako o1 može dostići ili nadmašiti performanse doktoranda iz kemije, biologije i matematike. No, izvješće OpenAI-ja ističe neke uznemirujuće rezultate za svakoga tko uzima odgovore ChatGPT-ja zdravo za gotovo.

OpenAI je otkrio kako je model GPT o3 uključio halucinacije u trećinu referentnog testa vezanog uz javne osobe. To je dvostruko veća stopa pogreške od ranijeg modela o1 iz prošle godine. Kompaktniji model o4-mini pokazao se još lošijim, halucinirajući na 48 posto sličnih zadataka.

Prilikom testiranja na pitanjima općenitijeg znanja za SimpleQA benchmark, halucinacije su se povećale na 51 posto odgovora za o3 i 79 posto za o4-mini. Prema jednoj od teorija koje kruže u istraživačkoj zajednici umjetne inteligencije, što više zaključivanja model pokušava izvesti, to je veća vjerojatnost kako će skrenuti s tračnica.

Opširniji odgovori, više kreativnosti

Za…

Pročitajte više na Tportal.hr

OpenAI proveo istraživanje: ChatGPT postaje sve pametniji i sve više izmišlja

Papa Lav XIV prvi je papa iz reda augustinaca. Ovo su razlike i sličnosti između najveća tri crkvena reda

Warriorsi nisu imali izgleda bez ozlijeđenog Stepha Curryja

Više iz rubrike

Prijete i nude novac: Očajni Rusi zbog Starlinka vrbuju obitelji zarobljenih Ukrajinaca

Žena koja regulira povijesnu zabranu u Australiji: ‘Godinama mi prijete neonacisti i trolovi’

Apokalipsa na kriptotržištu: Je li bitcoin mrtav?

Što je to tako snažno udarilo u Zemlju i odakle je došlo? Pojavio se mogući odgovor

Pingtok je opasan trend na TikToku: Nevjerojatno je što klinci rade za klikove

Europa se želi odvojiti od američke tehnologije. Evo kako to planira učiniti

Tko će kontrolirati internet iz svemira? Starlink dobio ozbiljnu konkurenciju

Umjetna inteligencija loša ‘u igranju doktora’: Samo mu je trećina dijagnoza bila točna

Najnovije

Petak 13. nosi dramu: Ovom znaku 'puca film', a evo tko mora hitno kod liječnika

U Dubrovniku ispod mosta pronađeno tijelo muškarca

Guverner Minnesote traži odštetu od Trumpove vlade. "Ostavili su generacijsku traumu"

Zelenski: Ne bojimo se ničega. Spremni smo za izbore i za referendum

online.sales@clicktag.hr

Welcome Back!

Retrieve your password