Umjetnu inteligenciju treba cijepiti zlom, kaže Anthropic

Kako bi se modeli umjetne inteligencije ponašali bolje, istraživači Anthropica ubrizgali su im dozu zla.

Ta je tvrtka objavila kako izlaganje velikih jezičnih modela ‘nepoželjnim vektorima persona’ tijekom obuke smanjuje vjerojatnost kako će modeli kasnije usvojiti štetna ponašanja.

Vektori persona su unutarnje postavke koje potiču reakcije modela prema određenim osobinama ponašanja – na primjer, biti koristan, toksičan ili ulizivački. U ovom slučaju, Anthropic je namjerno gurao model prema neželjenim osobinama tijekom obuke.

Pristup, naveli su, funkcionira poput bihevioralnog cjepiva. Kada se modelu da doza ‘zla’, postaje otporniji kada naiđe na podatke za obuku koji potiču ‘zlo’. Tim u Anthropicu naziva ovu metodu ‘preventivnim upravljanjem’. To je način izbjegavanja ‘nepoželjne promjene osobnosti’, čak i kada se modele trenira na podacima koji bi ih inače mogli natjerati na poprimanje štetnih osobina.

Iako se ‘zli’ vektor dodaje tijekom finog ugađanja, isključuje se tijekom implementacije, pa model zadržava dobro ponašanje, a istovremeno je otporniji na štetne podatke. Preventivno upravljanje prouzročilo je ‘malo ili nimalo…

Pročitajte više na Tportal.hr

Umjetnu inteligenciju treba cijepiti zlom, kaže Anthropic

Jelena Perčin i Ante Gelo doživjeli nesvakidašnju scenu u Budimpešti

Zastupnici u prvoj polovici godine potrošili 761.000 eura, najviše na stanarine

Više iz rubrike

Mobitel vam je spor i zatrpan aplikacijama? Ovaj besplatni alat pomoći će da ih sigurno uklonite

Vaša adresa e-pošte završila je na mračnom webu. Što sad? Evo par preporuka

Na Međunarodnu svemirsku stanicu stigla nova ekipa, bolesni astronauti se vratili

Hrvatska ide prema zabrani društvenih mreža za djecu: Hoćemo li svi morati ‘dokazivati’ tko smo?

Može li nas AI voljeti? Znanost ima jasan i pomalo jeziv odgovor

Fenomen Hikikomori u Italiji: Više od 200.000 mladih živi u potpunoj društvenoj izolaciji

Sony niotkud izdao novi God of War, u izradi remakeovi prva tri nastavka

Senzacija u Vijetnamu: ‘Ovo je jedno od najvećih svjetskih arheoloških otkrića’

Najnovije

Zubčić u prilici za rezultat karijere: 'Ovakvi uvjeti su dobra šansa'

U Poreču na Valentinovo pištoljem prijetili maloljetnicima, ukrali im novac i poklone

Trogirska policija u stanu žene pronašla više od kilograma amfetamina

Ante Matej Jurić: Neće biti lagano, ali mogu obećati da ćemo dati sve od sebe

online.sales@clicktag.hr

Welcome Back!

Retrieve your password