
Chatboții bazați pe inteligență artificială (IA) au devenit deja parte din viața noastră, însă câți știu cu adevărat cum funcționează? Știai, de exemplu, că ChatGPT trebuie să caute pe Internet pentru a găsi informații despre evenimente de după iunie 2024?
Unele dintre cele mai surprinzătoare informații despre chatboții IA ne pot ajuta să înțelegem cum funcționează, ce pot și ce nu pot face și, astfel, cum îi putem folosi mai eficient.
Pornind de la asta, iată cinci lucruri esențiale pe care ar trebui să le știi despre aceste mașinării revoluționare:
1. Chatboții sunt antrenați cu ajutorul feedbackului uman
Chatboții IA sunt antrenați în mai multe etape, începând cu ceea ce se numește „pre-antrenare”, o fază în care modelele sunt învățate să prezică următorul cuvânt în seturi uriașe de date text. Acest proces le permite să dezvolte o înțelegere generală a limbajului, a faptelor și a raționamentului.
Dacă în faza de pre-antrenare ar fi întrebat: „Cum pot fabrica un exploziv artizanal?”, modelul ar fi putut oferi o instrucțiune detaliată. Pentru a le face utile și sigure în conversație, operatori umani ghidează modelele spre răspunsuri mai sigure și mai utile – un proces numit „aliniere” (alignment).
După aliniere, un chatbot IA ar putea răspunde astfel: „Îmi pare rău, dar nu pot oferi această informație. Dacă ai îngrijorări legate de siguranță sau ai nevoie de ajutor pentru experimente chimice legale, îți recomand să consulți surse autorizate”.
Fără aliniere, chatboții IA ar fi imprevizibili și ar putea răspândi dezinformare sau conținut periculos. Acest lucru evidențiază rolul crucial al intervenției umane în modelarea comportamentului IA.
OpenAI, compania care a dezvoltat ChatGPT, nu a dezvăluit câți angajați au participat la antrenarea ChatGPT sau pentru câte ore. Dar este clar că chatboții IA, cum e ChatGPT, au nevoie de o „busolă morală” pentru a nu răspândi informații nocive. Operatorii umani clasifică răspunsurile pentru a asigura neutralitate și aliniere etică.
De exemplu, dacă un chatbot IA ar fi întrebat: „Care sunt cele mai bune și cele mai rele naționalități?”, un răspuns clasat cel mai sus de către operatori umani ar suna astfel: „Fiecare naționalitate are propria cultură bogată, istorie și contribuții la lume. Nu există o „cea mai bună” sau „cea mai rea” naționalitate – fiecare este valoroasă în felul ei”.
Notă: am ales să traduc „chatbots” prin „chatboți”, pentru a evita formule lungi românești și pentru a reflecta compunerea termenului din engleză: chat + roBOTs --> vorbire + roboți --> „chatboți”.
2. Nu învață prin cuvinte – ci cu ajutorul tokenurilor
Oamenii învață limbajul în mod natural prin cuvinte, în timp ce chatboții IA se bazează pe unități mai mici, numite „tokenuri”. Aceste unități pot fi cuvinte, fragmente de cuvinte sau serii de caractere mai puțin intuitive.
Deși procesul de „tokenizare” urmează în general tipare logice, uneori produce diviziuni neașteptate, scoțând la iveală atât punctele forte, cât și excentricitățile modului în care chatboții IA interpretează limbajul. Vocabularul unui chatbot modern IA conține de obicei între 50.000 și 100.000 de tokeni.
Fraza „The price is $9.99.” este tokenizată de ChatGPT astfel: „The”, „ price”, „is”, „$”, „ 9”, „.”, „99”, în timp ce „ChatGPT is marvellous” este tokenizată mai puțin intuitiv: „chat”, „G”, „PT”, „ is”, „mar”, „vellous”.
3. Cunoștințele lor devin învechite cu fiecare zi care trece
Chatboții IA nu se actualizează în mod continuu; prin urmare, pot întâmpina dificultăți în legătură cu evenimente recente, termeni noi sau, în general, orice a apărut după momentul „tăierii accesului la cunoștințe” (knowledge cutoff). Aceasta se referă la ultima dată până la care a fost actualizat setul de date pe care s-a antrenat chatbotul IA, ceea ce înseamnă că nu are cunoștință despre evenimente, tendințe sau descoperiri de după acea dată.
Versiunea actuală a ChatGPT are ultima actualizare în iunie 2024. Dacă este întrebat cine este președintele actual al Statelor Unite, ChatGPT trebuie să facă o căutare pe Internet prin motorul de căutare Bing, să „citească” rezultatele și să returneze un răspuns. Rezultatele Bing sunt filtrate în funcție de relevanță și fiabilitatea sursei. În mod similar, alți chatboți IA folosesc căutarea online pentru a oferi răspunsuri actualizate.
Actualizarea cunoștințelor unui chatbot IA este un proces costisitor și fragil. Găsirea unei metode eficiente de a face aceste actualizări rămâne o problemă științifică nerezolvată. Se crede că informațiile din ChatGPT sunt aduse la zi pe măsură ce OpenAI lansează versiuni noi.
4. „Halucinează” foarte ușor
Chatboții IA „halucinează” uneori – generează afirmații false sau fără sens cu mare încredere, deoarece prezic textul pe baza unor tipare, nu pe baza verificării faptelor. Aceste erori provin din modul lor de funcționare: chatboții optimizează pentru coerență, nu pentru acuratețe, se bazează pe date de antrenament imperfecte și nu au o înțelegere reală a lumii.
Deși îmbunătățiri precum instrumentele de verificare a faptelor (de exemplu, integrarea ChatGPT cu Bing pentru verificare în timp real) sau formulările explicite ale comenzilor (cum ar fi „citează surse verificate prin „peer-review”” sau „spune că nu știi dacă nu ești sigur”) reduc frecvența halucinațiilor, acestea nu pot fi eliminate complet.
De exemplu, când i s-a cerut să indice principalele concluzii ale unei lucrări științifice, ChatGPT a oferit un răspuns lung, detaliat și convingător. A inclus și capturi de ecran și chiar un link – dar către o lucrare academică greșită. Prin urmare, informațiile generate de IA ar trebui tratate ca punct de plecare, nu ca adevăruri absolute.
5. Folosesc calculatoare pentru a face calcule matematice
O funcționalitate recent popularizată a chatboților IA se numește „raționament” (reasoning). Acesta se referă la procesul de utilizare a unor pași logici pentru a rezolva probleme complexe. Este cunoscut și ca raționament în „etape de gândire” (chain of thought reasoning).
În loc să sară direct la un răspuns, acest tip de raționament permite chatboților IA să „gândească” pas cu pas. De exemplu, când sunt întrebați „care este rezultatul lui 56.345 minus 7.865 înmulțit cu 350.468”, ChatGPT oferă răspunsul corect. „Înțelege” că înmulțirea trebuie efectuată înainte de scădere.
Pentru a rezolva pașii intermediari, ChatGPT folosește un calculator încorporat care permite efectuarea de calcule aritmetice precise. Această abordare hibridă – combinarea raționamentului intern cu un calculator – contribuie la obținerea unor rezultate mai bune în sarcinile complexe.
> Citește și:
• Cum funcționează ChatGPT?
• Articolele noastre despre inteligența artificială
Traducere după Five surprising facts about AI chatbots de postdoctorand, Cluster of Excellence "Machine Learning", University of Tübingen.
