• Autor: Stiri.Click
  • Publicat: 2024-12-25 17:46:34
  • Sursa:
Un sistem AI a atins nivelul uman la un test de „inteligenta generala”. Ce inseamna acest lucru Imagine

Un nou model de inteligență artificială (AI) a obținut recent rezultate la nivel uman la un test conceput pentru a măsura „inteligența generală”.

Pe 20 decembrie, sistemul o3 al OpenAI a obținut un scor de 85% la benchmark-ul ARC-AGI, cu mult peste cel mai bun scor AI anterior de 55% și la egalitate cu scorul mediu uman. De asemenea, a dat rezultate bune la un test de matematică foarte dificil.

Crearea inteligenței generale artificiale, sau AGI, este obiectivul declarat al tuturor laboratoarelor majore de cercetare AI. La prima vedere, OpenAI pare să fi făcut cel puțin un pas semnificativ către acest obiectiv, explică doi specialiști în domeniu în publicația The Conversation.

În timp ce scepticismul rămâne, mulți cercetători și dezvoltatori AI simt că ceva tocmai s-a schimbat. Pentru mulți, perspectiva AGI pare acum mai reală, urgentă și mai apropiată decât se anticipase.

Pentru a înțelege ce înseamnă rezultatul o3, trebuie să înțelegem despre ce este vorba în testul ARC-AGI. În termeni tehnici, este un test al „eficienței eșantionului” a unui sistem AI în adaptarea la ceva nou - câte exemple de situație nouă trebuie să vadă sistemul pentru a-și da seama cum funcționează.

Un sistem AI precum ChatGPT (GPT-4) nu este foarte eficient în eșantionare. A fost „antrenat” pe milioane de exemple de text uman, construind „reguli” probabilistice despre combinațiile de cuvinte care sunt cele mai probabile.

Rezultatul este destul de bun la sarcini comune. Este prost însă la sarcini neobișnuite, pentru că are mai puține date (mai puține mostre) despre acele sarcini.

Până când sistemele AI pot învăța dintr-un număr mic de exemple și se pot adapta cu mai multă eficiență a eșantionului, acestea vor fi utilizate numai pentru lucrări foarte repetitive și pentru cele în care defecțiunile ocazionale sunt tolerabile.

Capacitatea de a rezolva cu acuratețe probleme necunoscute sau noi din eșantioane limitate de date este cunoscută drept capacitatea de a generaliza. Este considerat pe scară largă un element necesar, chiar fundamental, al inteligenței.

ARC-AGI testează pentru adaptarea eficientă a eșantionului utilizând probleme mici cum ar fi cea de mai jos. AI trebuie să descopere modelul care transformă grila din stânga în grila din dreapta.

Fiecare întrebare oferă trei exemple din care să înveți. Sistemul AI trebuie apoi să descopere regulile care „generalizează” de la cele trei exemple la al patrulea.

Nu știm exact cum a făcut OpenAI, dar rezultatele sugerează că modelul o3 este foarte adaptabil. Din doar câteva exemple, găsește reguli care pot fi generalizate.

Pentru a descoperi un model, nu ar trebui să facem presupuneri inutile sau să fim mai specifici decât trebuie să fim cu adevărat. În teorie, dacă poți identifica regulile „cele mai slabe” care fac ceea ce vrei, atunci ți-ai maximizat capacitatea de a te adapta la situații noi.

Ce înțelegem prin cele mai slabe reguli? Definiția tehnică este complicată, dar regulile mai slabe sunt de obicei cele care pot fi descrise în afirmații mai simple.

Deși nu știm încă cum OpenAI a obținut acest rezultat, pare puțin probabil să fi optimizat în mod deliberat sistemul o3 pentru a găsi reguli slabe. Cu toate acestea, pentru a reuși la sarcinile ARC-AGI, trebuie să le găsești.

Știm că OpenAI a început cu o versiune de uz general a modelului o3 (care diferă de majoritatea celorlalte modele, pentru că poate petrece mai mult timp „gândindu-se” la întrebări dificile) și apoi l-a antrenat special pentru testul ARC-AGI.

Cercetătorul francez de inteligență artificială Francois Chollet, care a proiectat benchmark-ul, consideră că o3 caută prin diferite „lanțuri de gândire” care descriu pașii pentru rezolvarea sarcinii. Apoi ar alege „cel mai bun” conform unei reguli vag definite sau „euristice”.

Dacă așa funcționează o3, atunci modelul de bază ar putea să nu fie cu mult mai bun decât modelele anterioare. Conceptele pe care modelul le învață din limbaj s-ar putea să nu fie mai potrivite pentru generalizare decât înainte. În schimb, este posibil să vedem doar un „lanț de gândire” mai generalizabil, găsit prin pașii suplimentari de pregătire a unei euristice specializate pentru acest test.

Aproape totul despre o3 rămâne necunoscut. OpenAI a limitat dezvăluirea la câteva prezentări media și testarea timpurie pentru câțiva cercetători, laboratoare și instituții de siguranță AI.

Înțelegerea cu adevărat a potențialului o3 va necesita o muncă extinsă, inclusiv evaluări, o înțelegere a distribuției capacităților sale, cât de des eșuează și cât de des reușește.

Când o3 va fi lansat în sfârșit, vom avea o idee mult mai bună dacă este aproximativ la fel de adaptabil ca un om obișnuit.

Dacă da, ar putea avea un impact economic uriaș, revoluționar, deschizând o nouă eră a inteligenței accelerate care se auto-îmbunătățește. Vom avea nevoie de noi puncte de referință pentru AGI în sine și de o analiză serioasă a modului în care ar trebui să fie guvernată. Dacă nu, atunci acesta va fi totuși un rezultat impresionant. Cu toate acestea, viața de zi cu zi va rămâne aproape aceeași, susțin specialiștii.

Preşedintele ucrainean Volodimir Zelenski a anunţat, joi seara, că a vorbit la telefon cu preşedintele american Joe Biden despre menţinerea asistenţei pentru Ucraina în 2024 şi a spus că va fi un „pachet semnificativ de sprijin”. Potrivit unor surse, Biden ar urma să anunţe că solicită Congresului aprobarea unor cheltuieli suplimentare de 100 de miliarde de dolari, din care 60 de miliarde de dolari ar fi ajutor acordat Kievului, potrivit News.ro. 

Economie 2023-10-20 08:27:24

Noaptea trecută a căzut prima prima zăpadă din această toamnă pe Transfăgărăşan, drumarii fiind nevoiți să intervină cu utilajele de curățat pe tronsonul dintre Bâlea Cascadă şi Bâlea Lac, unde se circulă în condiţii de iarnă.

Economie 2023-10-16 09:55:00

Organizaţia Mondială a Sănătăţii (OMS) a anunţat că a reunit peste 300 de experţi care vor avea misiunea de a întocmi o nouă listă cu agenţii patogeni susceptibili să cauzeze epidemii şi pandemii, şi de a studia ameninţările ce ar putea să apară de la virusuri necunoscute, informează Agerpres.

Economie 2022-11-21 19:42:37

6 plantații de canabis, cu mii de plante, au fost descoperite în județul Dâmbovița. Este vorba de o rețea de traficanți, care vindeau drogurile pe internet. 7 persoane au fost arestate pentru 30 de zile.

Economie 2024-06-03 09:19:59

Finlada va pregăti o „soluţie naţională” pentru a restrânge şi mai mult sau chiar a interzice complet accesul cetăţenilor ruşi, a declarat miercuri agenţiei France Presse ministrul de externe Pekka Haavisto, aflat la New York cu ocazia Adunării Generale a ONU.

Economie 2022-09-21 22:19:03

Purtătorul de cuvânt al PNL, Ionuţ stroe, afirmă vineri, într-o postare pe Facebook, că „extremiştii reprezentanţi de AUR, George Simion şi Diana Şoşoacă sunt un pericol real la adresa democraţiei şi stabilităţii”. Reacția vine după ce liderul AUR și senatorul Șoșoacă au încercat să se alăture, joi seară, fermierilor și transportatorilor care protestau și încercau să intre în București, fiind respinși și huiduiți de aceștia. „Sunt figuranţii obişnuiţi de la orice scandal”, iar scopul lor este „dezordinea, violenţa, o formă de anarhie din care ei să culeagă voturi”, susține Stroe.

Economie 2024-01-12 12:26:59

Premierul singaporez Lee Hsien Loong a anunţat duminica aceasta că guvernul său va abroga în viitorul apropiat o lege ce datează din perioada colonială şi care incriminează relaţiile sexuale între bărbaţi, însă nu va schimba definiţia legală a căsătoriei ca uniune între un bărbat şi o femeie, informează AFP şi Reuters.

Economie 2022-08-21 19:18:05

Elevii trebuie să-și schimbe locul în bancă cel puțin o dată în fiecare modul școlar. Este soluția propusă de Ministerul Educației pentru eliminarea discriminării pe criterii de etnie, performanțe școlare sau cerințe educaționale speciale. Dar specialiștii în educație și directorii au observații în legătură cu aceste măsuri.

Economie 2024-11-01 18:15:41