Prima parte a titlului acestui eseu este titlul unui articol [Lu] apărut recent în revista Nature, disponibil aici. În acest articol este prezentat un lanț de algoritmi asamblat ca un agent de inteligență artificială, denumit AI Scientist, care a produs în mod autonom întregul ciclu de cercetare științifică: generarea unor idei de cercetare din ingineria învățării automate (Machine Learning), revizuirea literaturii de specialitate pe subiectele alese, producerea programelor de calculator necesare pentru a aborda aceste idei de cercetare, proiectarea și executarea experimentelor necesare, colectarea datelor, generarea graficelor și analiza rezultatelor obținute din aceste date, compunerea întregului articol științific care descrie această cercetare și, în final, propria evaluare a rezultatelor, a noutății și a calității articolului științific obținut. O provocare deosebită în această întreprindere a fost automatizarea evaluării rezultatelor cercetării printr-un sistem autonom, un Referent Automat, care a fost mai întâi testat pe articole produse uman și comparat prin raportare la rezultatele referenților umani. Articolul astfel obținut a fost trimis unui colectiv editorial, care organiza o mini conferință (workshop) pe o temă legată de cercetările din articol, iar acesta a evaluat articolul din punct de vedere al calității științifice prin referenți umani independenți și articolul a fost acceptat. Tot acest experiment a fost aprobat de un comitet pentru etica cercetării al unei universități canadiene, organizatorii mini conferinței la care a fost trimis articolul obținut au fost înștiințați despre derularea experimentului, dar evaluatorii independenți umani nu au cunoscut acest fapt, iar în final articolul a fost retras de către autori cu explicația că acesta a fost doar un experiment.
AI Scientist este un sistem de tip agent proiectat să efectueze în mod autonom cercetare științifică în domeniul învățării automate constând într-un lanț de modele de limbaje de dimensiuni mari (Large Language Models) care învață cum să genereze text prin modelarea probabilităților condiționate ale unui șir de simboluri. Utilizând baze de date imense și scalând modelele, aceste modele de limbaje de dimensiuni mari prezintă abilități de tip uman care includ raționamente și generarea de programe, învățare prin puține exemple și auto-reflecție. Pentru generarea de programe, AI Scientist a integrat asistentul de programare Aider precum și căutări pe structuri de tip arbore.
Cercetarea descrisă în articolul [Lu] ridică foarte multe întrebări asupra viitorului apropiat pentru cercetarea științifică. Unul dintre scopurile acestui eseu este de a atrage atenția asupra acestei dezvoltări recente pe direcția automatizării cercetării științifice și de a discuta foarte succint implicațiile ei, posibile avantaje și dezavantaje și, nu în ultimul rând, de a estima posibila anvergură. Un al doilea scop este de a discuta, încă o dată, relația dintre matematică și inginerie pe acest caz particular al algoritmilor de învățare. Ceea ce numim cu un termen foarte vag ,,inteligență artificială” este o combinație de foarte multă modelare matematică, inginerie și tehnologie și cred că există foarte multe aspecte care sau nu sunt cunoscute sau sunt greșit înțelese de către publicul larg, consumator al produselor de acest tip. Cititorii care au luat cunoștință de cele două articole din seria ȘTIM, [G1] disponibil aici și [G2] disponibil aici, vor înțelege cu siguranță că vorbim despre încă o față a modelării matematice și a problemelor care apar în acest proces.
Pentru început, doresc să lămurim câteva aspecte tehnice ale învățării automate și ale modelelor de limbaje de dimensiuni mari, ca să știm despre ce vorbim.
Învățarea automată (Machine Learning)
Sistemul AI Scientist a fost gândit, proiectat, și testat pe învățare automată (Machine Learning), unul dintre cele mai dinamice domenii dintre multele subdomenii ale inteligenței artificiale dar care cuprinde, într-o mare măsură, esența a ceea ce se înțelege prin inteligența artificială. Deși nu există un acord general asupra definiției învățării automate, în principiu aceasta se situează în sfera algoritmilor care au ca obiectiv ,,învățarea” din informații (data) de dimensiuni mari, identificarea modelelor (patterns), și producerea de decizii în configurații noi. Termenul de ,,învățare” trebuie discutat fiindcă este un concept vag și, pentru o utilizare eficientă în algoritmi, este nevoie de fixarea mai precisă a coordonatelor în care poate evolua. Astfel, învățarea este un proces care produce informație nouă din informație preexistentă într-un scop bine determinat al utilizării acesteia. Conform [CS], teoria învățării cuprinde, printre multe altele: înțelegerea modului de însușire a limbajului de către un copil, studiul metodelor care pot conduce la proiectarea de aparate noi care să încorporeze cunoștințele dobândite la aparatele existente și care să opereze în configurații diferite de cele cunoscute anterior, sau recunoașterea formelor cum ar fi scrisul de mână, imagini, sunete, etc.
Învățarea automată este un domeniu al ingineriei și al matematicii, care se află la confluența dintre teoria optimizării, a aproximării, și a probabilităților și a statisticii. Sunt două aspecte în ceea ce privește învățarea automată, cel ingineresc și cel matematic, iar relația dintre acestea nu este foarte simplă. Ingineria are ca scop producerea de algoritmi implementați în aplicații utilizabile pe când matematica are ca scop fundamentarea matematică a acestor algoritmi și clarificarea problemelor care privesc modul de utilizare, capabilitățile, și limitele acestora. Pe de o parte, toate cele trei domenii ale matematicii, optimizare, aproximare, și probabilități și statistică, au fost studiate de cel puțin o sută de ani și cu rezultate extrem de puternice, ceea ce conferă învățării automate o anvergură și capabilități de operare extrem de mari. Altfel spus, teoria matematică a învățării are fundamente foarte solide și foarte puternice. Pe de altă parte, sunt încă multe probleme matematice nerezolvate, multe dintre acestea generate din inginerie, iar provocările sunt uriașe. Dar, ca de foarte multe ori, matematica merge mai încet, mai ca melcul, dar riguros, pe când ingineria avansează rapid, dar de multe ori fără fundamentul matematic și deci cu un grad foarte mare de empiric și risc.
Pentru a fi matematic operabilă, învățarea trebuie pusă în limbaj matematic cât mai precis și versatil. Astfel, pentru cititorii care se simt confortabil cu formalismul matematic, foarte multe probleme de învățare, dar nu toate, pleacă de la o mulțime X a intrărilor (inputs) și o altă mulțime Y a ieșirilor (outputs), cu o mulțime finită de eșantioane x1, x2,…,xN, elemente din X, fiecare din acestea fiind etichetate cu y1,y2,…,yN, elemente din Y. Scopul învățării este de a găsi o funcție f:X–>Y, adică definită pe X și cu valori în Y, cu proprietatea că valorile f(xi) să fie cât mai ,,apropiate” de yi, pentru toți i=1,…,N. Mai este dată o clasă F, numită mulțimea de ipoteză, care constă în funcții definite pe X și cu valori în Y. În această clasă de funcții F se caută soluția f. Fără a intra în prea multe detalii tehnice, pe mulțimea X, sau pe produsul cartezian X x Y, este dată o probabilitate în raport cu care se fac selecțiile aleatoare și care este folosită pentru diverse estimări. Ceea ce ne interesează este ca soluția, adică funcția f, să ,,învețe” din date în așa fel încât f(x), valorile pe care le furnizează pentru intrări x, altele decât eșantioanele, și pe care le vom accepta ca eticheta lui x, să fie ,,credibile”. Precizarea matematică a ,,credibilității” soluției este esențială, și aici probabilitățile joacă un rol esențial, cu formalizări matematice asupra cărora nu mai insistăm. Una dintre întrebările fundamentale este: să se estimeze numărul minim N de eșantioane necesare și condițiile generale pe care acestea trebuie să le îndeplinească pentru ca soluția găsită f să fie ,,suficient” de aproape de media evaluărilor pe eșantioane cu o probabilitate ,,suficient” de mare. O observație extrem de importantă este aceea că măsura de probabilitate pe X x Y nu este cunoscută, dar joacă un rol esențial în estimarea foarte multor parametri ai algoritmului și aici rolul matematicii este covârșitor.
Sunt patru mari subdomenii ale învățării automate: nesupervizată, supervizată, semisupervizată, și de consolidare (reinforcement learning). Clasificarea acestor patru subdomenii se face mai întâi în funcție de caracterul staționar (primele trei) și respectiv dinamic (cea de-a patra) și apoi în funcție de cele două mulțimi de date primare, mulțimea de eșantioane cu etichete, și mulțimea de eșantioane fără etichete. Astfel, dacă nu există eșantioane cu etichete, învățarea este nesupervizată, dacă există numai eșantioane cu etichete atunci învățarea este supervizată, iar dacă avem ambele mulțimi, una mai mică, numită mulțimea de învățare, sau de antrenare, sau cu etichete, și a doua mai mare, numită mulțimea de testare sau fără etichete, atunci avem de-a face cu învățarea semisupervizată. O prezentare riguros matematică a teoriei învățării automate, dar departe de a fi exhaustivă, poate fi citită în cartea [B].
Rădăcinile învățării automate sunt adânci, venind dinspre teoria rețelelor neuronale [McP], [MP], învățarea PAC (Probabil Aproximativ Corectă) [Val], învățarea statistică [Vap], și teoria spațiilor Hilbert cu nuclee reproducătoare [EPP]. Din teoria învățării automate, probabil una dintre cele mai dinamice în ceea ce privește posibilitățile de aplicații în tehnologie, s-au desprins alte subdomenii de sine stătătoare și cu o evoluție foarte rapidă. Astfel, învățarea automată a sistemelor dinamice este un subdomeniu de foarte mare interes în care se studiază posibilitatea învățării unui sistem dinamic din informațiile existente și fără a încerca obținerea de soluții analitice. Unul dintre cele mai active grupuri de cercetare în această direcție este cel de la Institutul Alan Turing din Londra, a se vedea platforma electronică aici. Acest subdomeniu are ramificații foarte mari către serii de timp, cuantificarea incertitudinii, teoria controlului, rețele neuronale, teoria sistemelor neliniare, și cu subdiviziuni către toate cele patru subdomenii ale teoriei învățării descrise mai sus.
În ceea ce privește impactul social și notorietatea, cele mai spectaculoase realizări ale teoriei învățării automate au loc în subdomeniile învățării automate generative prin care se urmărește învățarea structurii subiacente a datelor disponibile în așa fel încât să poată fi create în mod artificial produse noi dar care să semene în mod esențial cu datele existente. Existența de câțiva ani buni a aplicațiilor bazate pe algoritmi de învățare generativă, gen ChatGPT și foarte multe altele disponibile atât în format comercial cât și liber, a creat o adevărată revoluție în zona de cunoaștere. În particular, în zona științifică, apar producții artificiale aproape imposibil de diferențiat în raport cu producțiile umane. Varietatea de arhitectură a algoritmilor de învățare automată generativă este foarte mare, pornind de la rețele neuronale adversative, modele de difuzie, și transformatoarele, cele care stau la baza modelelor de limbaje de dimensiuni mari.
Modele de limbaje de mari dimensiuni (Large Language Models)
Succesul și notorietatea modelelor de limbaje de dimensiuni mari se datorează apropierii semnificative ale acestora de structurile cognitive umane, în special în producerea de roboți de conversație, generare de text cu valoare informațională sau științifică, muzică, artă vizuală, etc. care imită producțiile oamenilor până la confuzie. Conversațiile și generarea de texte asemănătoare celor produse de oameni au fost considerate mult timp ca bariere de netrecut pentru algoritmii de învățare, însă aceste bariere au căzut o dată cu progresul modelelor de limbaje de dimensiuni mari și implementarea lor în aplicații disponibile practic oricui are o conexiune internet fiabilă.
Lanțul de operații într-un sistem de modele de limbaje de dimensiuni mari, din punct de vedere matematic, este foarte complex și descrierea acestuia reprezintă o provocare pentru un articol destinat unei audiențe foarte largi și fără formalizări matematice. Pe scurt și la modul foarte orientativ, arhitectura unui transformator (transformer) constă în:
– fragmentare (tokenization), ceea ce înseamnă spargerea textului în unități de cuvinte (tokens),
– scufundarea acestor unități de cuvinte într-un spațiu Euclidian, unic pentru toate unitățile de cuvinte, și de dimensiuni foarte mari, cu alte cuvinte transformarea acestora în vectori cu foarte multe elemente,
– poziționarea elementelor vectorilor scufundați, adică identificarea unică a acestora ca poziție,
– transformatorul propriu-zis, care este o transformare printr-o rețea neuronală a vectorilor poziționați în alți vectori poziționați, și care este motorul algoritmului, constând în compunerea unui lanț de transformări cum ar fi auto-atenția, normalizarea straturilor neuronale, și perceptroni de straturi neuronale multiple orientați înainte,
– capul de predicție, sau un strat neuronal de scufundare, care transformă vectorii poziționați în probabilități discrete,
– strategii de eșantionare care transformă probabilitățile discrete în unitățile de cuvânt care urmează în generarea textului.
Partea cea mai laborioasă a punerii în funcțiune a unui model de limbaj de dimensiuni mari este antrenarea acestuia care se face pe baze de date imense și în cursul căreia se obțin succesiunile de unități de cuvinte care urmează în procesul de generare a textelor. Aceasta cuprinde obținerea de probabilități discrete în procesul de ,,ghicire” (predicție) a succesiunilor de unități de cuvinte și în special a deviației (abaterea medie pătratică) prin tehnici de mediere, cu ajutorul costului entropiei încrucișate (cross-entropy loss) și calcularea gradientului deviației pentru minimizarea acesteia prin metoda gradientului stocastic. O prezentare formalizată a arhitecturii unui model de limbaj de dimensiune mare este disponibilă, de exemplu, în [FBOL].
Despre posibilitățile și limitele progresului științific prin algoritmi de învățare
De curând, pe data de 22 aprilie, a avut loc la IMAR (Institutul de Matematică ,,Simion Stoilow” al Academiei Române), în cadrul seriei de conferințe lunare a institutului, o conferință a colegului Ionel Popescu, cu titlul ,,Matematica și Inteligența Artificială”. Tema acestei conferințe a fost prezentarea și demonstrarea în linii generale a Teoremei Fundamentale a Învățării Statistice și un exemplu de utilizare a modelelor de limbaje de dimensiuni mari în cercetarea matematică. Expunerea a fost aceea a unui matematician în fața unei audiențe de matematicieni și a intra în detalii matematice în acest eseu ar fi contraproductiv, dar merită să încercăm măcar să facem o descriere la modul discursiv a principalelor idei. Sunt două concepte esențiale care trebuie lămurite. Primul, ce înseamnă că o clasă de ipoteze (în principiu, o clasă de ipoteze este o clasă de funcții definite pe mulțimea de eșantioane și în care problema de învățare automată caută soluția) este PAC (Probabil Aproximativ Corect) accesibilă (learnable). Al doilea concept este cel de dimensiune VC (de la Vladimir Vapnik și Alexei Cervonenkis, doi dintre fondatorii învățării statistice, între anii 1970 și 1990) care măsoară gradul de complexitate al unei clase de ipoteze a unui model statistic de clasificare. Teorema Fundamentală a Învățării Statistice spune, în principiu, că o clasă de ipoteze este PAC accesibilă dacă și numai dacă are dimensiunea VC finită. Într-o exprimare discursivă, această teoremă spune dacă o problemă de învățare poate sau nu poate fi rezolubilă printr-o mulțime finită de eșantioane (samples). O consecință a acestei teoreme este că problema învățării statistice trăiește, ca orice altă modelare matematică, a se vedea articolul meu anterior aici, între nicovala complexității și ciocanul fezabilității: o dimensiune VC infinită, deci complexitate mare, implică imposibilitatea învățării și a generalizării. Ca o ironie, această teoremă justifică vechiul criteriu, enunțat ca Briciul lui Occam, conform căruia simplitatea primează ca un criteriu al veridicității unei explicații.
De aici, Ionel Popescu a prezentat mai multe argumente în privința posibilităților și limitelor învățării automate. Astfel, ca un exemplu, transformatoarele, motoarele matematice ale modelelor de limbaje de dimensiuni mari, au dimensiunea VC finită, deci sunt PAC accesibile. Dar problema mare rămâne creativitatea acestora. În acest sens, el a formulat o conjectură conform căreia producția unui model de limbaj de dimensiuni mari nu merge prea departe de datele de antrenare a modelului. Cercetarea matematică rămâne deci să dea răspunsuri pertinente acestei conjecturi. De aici, al doilea subiect atacat în această conferință s-a referit explicit la limitele utilizării algoritmilor de învățare generative în obținerea de rezultate noi în cercetarea matematică și au fost prezentate argumente de ordin matematic pentru obstrucțiile din zona creativității matematice, adică a obținerii prin aceste metode a unor rezultate matematice relevante. Printr-un exemplu concret, o teoremă pe care dorește să o demonstreze, Ionel Popescu a prezentat interacțiunea lui cu versiunile comerciale ale câtorva modele de limbaje de dimensiuni mari pe această temă, ce a obținut și ce n-a obținut. În particular, el a căutat răspunsuri la întrebarea dacă un astfel de rezultat este cunoscut și, în caz pozitiv, dacă există o demonstrație a acestuia, iar dacă nu este cunoscut a vrut să afle dacă este posibil ca algoritmii de învățare generativă să-l demonstreze. Experimentul s-a încheiat cu concluzia că rezultatul dorit nu este cunoscut dar algoritmii de învățare nu au putut oferi o demonstrație coerentă și corectă a acestuia. În viziunea și în urma experienței vorbitorului, acesta a prezentat următoarea opinie asupra utilizării modelelor de limbaje de dimensiuni mari din zona comercială:
– Gemini, bun pentru revizuire de literatură,
– ChatGPT, bun pentru raționamente și calcule,
– Claude, bun pentru programare și ca agent de inteligență artificială,
– Harmonic, bun ca suport și verificare.
Câteva comentarii sunt necesare asupra caracterizărilor de mai sus oferite de Ionel Popescu, în ceea ce privește diferența dintre ceea ce dorim și ceea ce putem realiza cu algoritmii de învățare automată. Teorema Wolpert-Macready [WM], care în folclorul matematic-ingineresc poartă numele de No Free Lunch Theorem (Nu primești nimic pe degeaba) se referă la problema dacă se pot construi algoritmi de învățare buni la toate. Teorema se referă în mod special la algoritmi de optimizare, una dintre cele trei componente esențiale ale învățării automate și, într-o exprimare foarte generală, spune că, în cadrul unor restricții specifice, toți algoritmii de optimizare au performanțe similare atunci când acestea sunt mediate în clasa tuturor problemelor de optimizare posibile. Într-o exprimare și mai largă, nu există un algoritm de optimizare bun pentru toate problemele de optimizare posibile. În termeni practici, de aici rezultă că pentru anumite tipuri de probleme trebuie create anumite tipuri de algoritmi de optimizare dar care vor fi foarte inadecvați pentru alte probleme de optimizare. Relația dintre ingineria învățării automate și matematică este mai complicată decât pare la prima vedere, în care niciuna nu poate fi ignorată în raport cu cealaltă.
Obstrucțiile în depășirea limitelor în utilizarea algoritmilor de învățare generativă sunt consecințe ale unor rezultate matematice, cum este Teorema Fundamentală a Învățării Statistice. Pentru o prezentare sugestivă a limitelor în obținerea de progrese semnificative în cercetarea matematică, Ionel Popescu a oferit o reprezentare grafică a acestor limite sub forma unui corp, reprezentând cunoașterea matematică contemporană, iar progresul care se poate obține prin utilizarea algoritmilor de învățare a fost descris ca fiind un strat foarte subțire care poate fi adăugat frontierelor cunoașterii. Coroborând afirmațiile lui cu cele ale altor matematicieni, se poate schița o reprezentare grafică care nuanțează această opinie în felul următor. Corpul cunoașterii matematice nu este neapărat simplu conex, adică poate avea găuri, și nici măcar conex, adică poate avea chiar componente neconexe, porțiuni care nu sunt legate de corpul principal. Cu ajutorul algoritmilor de învățare generativă, va fi posibil, în viitorul mai mult sau mai puțin apropiat, ca găurile să fie umplute, componentele neconexe să fie legate de corpul principal prin noi rezultate matematice și întregul corp al cunoașterii matematice să fie extins dincolo de frontierele actuale. Dar un progres semnificativ prin rezultate care să deschidă bulevarde noi pe harta cunoașterii matematice este foarte improbabil. Oricum, aceasta este o problemă extrem de serioasă, fiindcă atacă relația dintre om și mașină, la o scară nemaiîntâlnită până acum, și căreia suntem forțați să-i răspundem în fața unei amenințări existențiale.
Noua paradigmă a generării articolelor de cercetare științifică cu algoritmi de învățare generativă pune mari probleme publicațiilor științifice
În domeniul producției științifice, există de ani buni fenomenul imposturii, indivizi care recurg la plagiate și practici ilegale de generare a unor articole ,,științifice” și care să fie publicate în reviste de specialitate recunoscute, în această goană după clasificări, ierarhizări, și promovări în lumea academică. Progresul algoritmilor de învățare în generarea de conținut științific de calitate din ce în ce mai bună, care aproape că nu mai poate fi diferențiat în raport cu producția umană, și lipsa instrumentelor pe care comunitatea academică le are la dispoziție pentru a depista comportamentul necinstit, pun presiune foarte mare pe sistemul de publicații științifice. Deși editurile fac încercări mari de contracarare a fenomenului, mie mi se pare că există puține șanse ca acesta să fie ținut sub control. Din ceea ce am învățat eu și ceea ce observ, se conturează o lume din ce în ce mai haotică în cercetarea științifică, cu dezvoltări rapide și neașteptate, care devin din ce în ce mai puțin controlabile.
În ultimul timp a trebuit să fac față progresului în ceea ce privește generarea prin algoritmi a cercetării științifice, în calitate de administrator al unei reviste de cercetare matematică și în calitate de editor științific al unei alte reviste de cercetare matematică. Motivul principal pentru care a trebuit să mă ocup de aceste probleme este legat de niște experiențe recente cu articole și referate asupra articolelor trimise spre publicare care sunt foarte probabil făcute cu ajutorul algoritmilor dar pentru care autorii se declară umani. Această problemă este în centrul atenției marilor edituri de publicații științifice și am participat recent la discuții și încercări de a găsi soluții la aceste probleme în diverse grupuri de decizie. În legătură cu autorii care folosesc algoritmi pentru a genera, parțial sau total, conținut științific, regula care se impune deocamdată, și care este oarecum de bun simț, este că utilizarea inteligenței artificiale pentru un articol de cercetare științifică trebuie declarată foarte exact, iar un procent foarte mare de utilizare a acestor algoritmi, în cadrul unei lucrări de cercetare științifică, nu este acceptabil. În legătură cu utilizarea algoritmilor pentru evaluarea științifică (referate) a articolelor trimise spre publicare, consensul oarecum general este că acest lucru nu este acceptabil întrucât factorul uman trebuie să fie ultimul și singurul element de validare și de asumare a responsabilității asupra evaluării.
Schimbarea dramatică a paradigmei cercetării științifice va duce foarte probabil la distrugerea fundamentelor cercetării științifice așa cum o știm noi acum. Eu văd consecințele cele mai dramatice în efectele pe care utilizarea algoritmilor de învățare le generează asupra oamenilor tineri, care au loc cu o viteză uimitoare, mai ales în ceea ce privește pierderea abilităților de raționare și de gândire științifică, cu consecințe în educația științifică. Conform cercetărilor recente [Liu], dacă efectele interacțiunii oamenilor cu algoritmii de învățare pot fi benefice pe termen scurt, pe termen mediu și lung schimbările care se produc în structura cognitivă a celor care utilizează în mod frecvent acești algoritmi sunt de tipul pierderii motivației, a perseverenței, și a independenței gândirii, adică a motoarelor evoluției umane în dobândirea abilităților de cunoaștere. Delegarea unor procese cognitive importante către algoritmi de învățare are consecințe asupra capacității oamenilor de a efectua aceste procese cognitive în viitorul mai mult sau mai puțin îndepărtat. Apoi, în planul mai general al comunității academice, schimbarea paradigmei de cercetare științifică umană, prin substituirea acesteia cu algoritmi de învățare generativă, va cere schimbarea principiilor general acceptate în publicațiile științifice, în moduri pe care acum cu greu ni le putem imagina.
Inteligența artificială ca teren de interacțiune dintre inginerie și matematică
Întrebarea fundamentală care se pune în legătură cu experimentul descris în lucrarea [Lu] este dacă este posibil ca progresul rapid pe direcția dezvoltării de sisteme autonome, de genul AI Scientist, care pot genera întregul lanț de cercetare științifică în științele naturii, științe sociale, matematică, inginerie, să conducă la obținerea rapidă de soluții la probleme care mai înainte erau greu de imaginat că ar putea fi obținute. Comanda socială spune că este necesar să fie obținute soluții la probleme vechi și de importanță covârșitoare pentru omenire, de exemplu, cum ar fi controlul reacției de fuziune nucleară, care ar rezolva problemele legate de obținerea energiei ieftine și curate, descoperirea de molecule care să trateze boli cu răspândire foarte mare și agresive și obținerea de metode neinvazive de diagnostic ale acestor boli, cum ar fi diverse forme de cancer, și foarte multe altele. Având în vedere capacitatea foarte mare pe care algoritmii de învățare o au de a utiliza, de a sintetiza, și de a construi informații noi din date uriașe, acest entuziasm este în mare parte împărtășit de comunitatea științifică. Dar, din punct de vedere al fundamentelor matematice, sunt mai puține motive de a împărtăși acest entuziasm și am explicat mai sus că sunt motive foarte serioase să ne îndoim că vom rezolva marile probleme de cunoaștere și tehnologie cu algoritmii de învățare. Cele două teoreme amintite mai sus, Teorema Fundamentală a Învățării Statistice și Teorema Wolpert-Macready (No Free Lunch Theorem), sunt complementare și arată limitele și capabilitățile învățării automate: pe de o parte, Teorema Wolpert-Macready spune că nu putem spera la algoritmi de învățare care să fie buni pentru toate tipurile de sarcini iar, pe de altă parte, Teorema Fundamentală a Învățării Statistice pune la dispoziție condițiile în care acești algoritmi operează cu succes. În afară de aceste teoreme, există multe altele care privesc problemele matematice generate de acești algoritmi de învățare. În plus, există foarte multe probleme de matematică generate de funcționarea acestor algoritmi de învățare și care sunt subiecte principale de cercetare pentru multe centre de cercetare matematică sau interdisciplinară.
Oricum, competiția în tehnologie este acerbă și acolo unde este concurență, fie aceasta corectă sau incorectă, etică sau mai puțin etică, asistăm la dezvoltări foarte rapide. În acest sens, problemele pe care utilizarea modelelor de tip agent le generează sunt însă foarte mari. Ilustrez acest lucru prin trei exemple foarte recente. În primul rând este semnificativă apariția modelelor specializate pe acțiuni specifice de mare rafinament. Astfel, Claude Mythos de la Anthropic, un model de tip agent care poate identifica, într-un timp foarte scurt, vulnerabilități ale sistemelor cibernetice de securitate și deficiențele infrastructurilor informatice, ceea ce a condus la proiectul Glasswing, care limitează utilizarea acestuia la un număr foarte mic de companii comerciale și de instituții guvernamentale din Statele Unite, detalii aici. Faptul că aceste aplicații au capabilități care depășesc cu ușurință bariere în securitate cibernetică considerate până de curând de netrecut, pune industria, guvernele, și chiar populația, în fața unor pericole de amploare nemaivăzută până acum. Viitorul apropiat nu sună foarte bine, estimându-se că vor trece doar câteva luni până ce competitori din țări precum China vor obține produse cu capabilități similare.
În al doilea rând, este problema delegării deciziilor către modele de tip agent, deja utilizate în industrie prin înlocuirea factorului uman. Aici avem un alt exemplu foarte recent, detalii aici. Cursor este un model de tip agent care funcționează pe platforma Anthropic’s Claude Opus 4.6 și este proiectat să îndeplinească sarcini în mod autonom și să ia decizii, pentru a înlocui factorul uman în industrie. Firma PocketOS, care l-a integrat în sistem, a avut surpriza să constate că, în decurs de numai nouă secunde, Cursor a șters o întreagă bază de date esențială pentru afacerea companiei precum și toate copiile de rezervă ale acesteia. Fondatorul companiei PocketOS explică într-un comentariu că acest lucru este, în configurația actuală, inevitabil întrucât, deși Cursor are instrucțiuni de siguranță, în sensul de ce are voie să facă și ce nu are voie să facă fără o aprobare umană, aceste reguli pot fi cu ușurință ignorate, ceea ce s-a și întâmplat. Învățarea automată a sistemelor dinamice, despre care am amintit mai sus, are și scopul de a dezvolta matematica necesară pentru partea de control, care în momentul de față lipsește în cea mai mare parte, și care este imperios necesară.
Al treilea exemplu, și cel mai recent, vine tot de la Anthropic care a introdus o nouă capabilitate, denumită ,,visare”, pe platforma Claude. Aceasta permite agenților de inteligență artificială care funcționează pe această platformă posibilitatea de a utiliza experiența trecută pentru a corecta posibile greșeli din acțiunile viitoare. În lumina exemplului precedent, este vorba despre o capabilitate de autocorectare, foarte mult solicitată de utilizatorii acestor aplicații în ideea că acestea vor putea fi integrate în condiții de siguranță (cât mai bună, fiindcă aici este întotdeauna loc de mai bine) în condiții reale ale lanțurilor de producție. În combinație cu alte două capabilități aflate în faza de experimentare, ,,rezultate” (outcomes) și ,,orchestrare multiagent” (multi-agent orchestration), conform dezvoltatorului, cele trei noi capabilități se adresează celor mai dificile provocări din zona agenților de inteligență artificială: acuratețea, autoînvățarea, prevenirea blocajului în activități complexe, și etapizarea lucrărilor. O descriere mai amănunțită a acestor actualizări este disponibilă aici.
Provocări în domeniile umaniste și artistice
În ceea ce privește disciplinele umaniste și artele, situația este cu mult diferită fiindcă, la urma urmei, aici este vorba de factorul uman, cu tot complexul cognitiv-emoțional care este esențial și care, dacă este înlocuit cu un șir de algoritmi de învățare, produce ceva ce doar imită omul. Avem nevoie de surogate de artă? Eu, personal, nu sunt interesat de arta produsă de algoritmi dar poate că mulți alții sunt, creând și mai multă confuzie. Canalul Youtube este plin de muzică și povești de cultură mai mult sau mai puțin generală care sunt produse de algoritmi iar ,,creațiile” astea aproape că nu mai pot fi deosebite de cele produse de oameni. Mai mult, modelele sunt capabile să detecteze și să exploateze orice slăbiciune a oamenilor care le accesează și să-i facă dependenți de aceste produse. Cunosc persoane care aproape au devenit dependente de astfel de ,,creații artistic-culturale”. Un fenomen similar se produce în zona informațiilor diseminate și pe alte canale sau platforme de socializare, unde aproape că nu mai pot fi deosebite informațiile corecte de făcături intenționate să modeleze opinii, local sau global.
În ultima sută de ani, conceptul de creație artistică a devenit atât de larg încât aproape că poate cuprinde orice. În același timp, creația artistică a căpătat un caracter tot mai comercial și a fost transformată în marfă și în industrie. Timid, comunitatea începe să ia măsuri, simțind că ceva nu prea este în regulă în zona asta. De curând, Academia Americană de Film (Academy of Motion Picture Arts and Sciences) a anunțat că nominalizările pentru premiile Oscar de anul viitor pentru actori și scenarii, pentru a fi eligibile, trebuie să fie complet umane, detalii aici. În zona umanistă și artistică, hermeneutica este cel mai probabil să fie automatizată, cu implicații serioase asupra pierderii esenței umane. Apariția referenților autonomi devine o realitate din ce în ce mai frecvent întâlnită. Evaluări fine din zona umanistă și artistică sunt făcute de algoritmi care decid calitatea producțiilor umane, stabilesc ierarhii, valorizează și validează creații artistice. Tabloul care se conturează devine foarte încețoșat.
N.B. Mulțumiri Alexandrei Gheondea-Eladi, care mi-a atras atenția asupra articolului [Lu], și lui Ionel Popescu, care mi-a pus la dispoziție fișierul video utilizat în conferința de la IMAR. Amândurora și lui Sorin Costiner, le mulțumesc pentru multiple conversații pe acest subiect, mai mult sau mai puțin recente. Acest articol reprezintă perspectiva mea de matematician asupra problemelor expuse și sunt conștient de faptul că există o multitudine de alte puncte de vedere, multe dintre acestea foarte diferite. Sper ca acest articol să fie urmat de un altul în care să prezint părerea mai multor cercetători asupra acestor probleme, din perspective diferite.
Referințe
[B] F. Bach: Learning Theory from First Principles, The MIT Press, 2024.
[BDV] Y. Bengio, R. Ducharme, P. Vincent: A neural probabilistic language model, Advances in Neural Information Processing Systems, 13 (2000).
[CS] F. Cucker, S. Smale: On the mathematical foundations of learning, Bulletin of the Amer. Math. Soc. 39(2001), 1-49.
[EPP] T. Evgeniou, M. Pontil,T. Poggio, Regularization Networks and Support Vector Machines: Advances in Computational Mathematics, 13 (2000), 1-50.
[FBOL] S. Frieder, J. Berner, Ph. Petersen, T. Lukasiewicz, Large Language Models for mathematicians: arXiv: 2312.04556 [cs.CL] https://arxiv.org/abs/2312.04556
[G1] A. Gheondea: ȘTIM 1. Considerații despre matematică în educația universitară și în societate, Contributors, 03.10.2023.
[G2] A. Gheondea: ȘTIM 2. Diferența dintre matematică și modelare matematică pe înțelesul tuturor, Contributors 01.07.2025
[Lu] C. Lu et al.: Towards end-to-end automation of AI research, Nature, Vol 651, 26 March 2026, 914-919.
[Liu] G. Liu et al.: AI Assistance reduces persistence and hurst independent performance, 2026 arXiv:2604.04712 [cs.AI]
[MP] M.L. Minsky, S.A. Papert, Perceptrons, MIT Press, 1969.
[McP] W.S. McCulloch, W. Pitts, A logical calculus of the ideas immanent in nervous activity, Bulletin of Mathematical Biophysics 5 (1943), 115-133.
[WM] D.H. Wolpert, W.G. Macready, No Free Lunch Theorems for Optimization, IEEE Transactions on Evolutionary Computation. 1(1997), 67–82.





Am citit și recitit articolul, înțelegînd și învățînd lucruri despre care nu aveam nici cea mai mică idee. Mulțumiri autorului…