• Autor: Stiri.Click
  • Publicat: 2024-07-29 07:00:41
  • Sursa:
Sistemele AI ar putea incepe sa vorbeasca „pasareasca”, avertizeaza cercetatorii Imagine

Sistemele IA ar putea să devină nonsens, pe măsură ce tot mai mult din conținutul de pe internet este generat de inteligența artificială, au avertizat cercetătorii, relatează The Independent. În ultimii ani, a crescut entuziasmul pentru sistemele care generează text, cum ar fi Chat GPT de la OpenAI, fapt pentru care multe persoane au avut postări pe blog și alte conținuturi create de IA. Astfel, tot mai mult conținut online a fost produs de inteligența artificială.

Totuși, multe dintre companiile care produc sisteme IA folosesc texte preluate de pe internet pentru a le antrena. Acest lucru ar putea crea o buclă în care aceleași sisteme IA utilizate pentru a produce acel text sunt apoi antrenate pe acesta.

Asta ar putea face ca acele instrumente IA să vorbească „păsărească” și nonsensuri, au atras atenția cercetătorii, într-o lucrare. Avertismentele lor vin în contextul unei îngrijorări generale legate de „teoria internetului mort”, care sugerează că o tot mai mare partea a internetului devine automatizată, ceea ce s-ar putra transforma într-un cerc vicios.

Potrivit studiului, este nevoie doar de câteva cicluri de generare și antrenare pe acel conținut, pentru ca aceste sisteme de inteligență artificială să producă nonsensuri.

De exemplu, cercetătorii au descoperit că un sistem testat cu text despre arhitectura medievală a avut nevoie de doar nouă generații înainte ca rezultatul să fie numai o listă nesfârșită de noțiuni fără sens.

Conceptul de inteligență artificială antrenată pe seturi de date create tot de IA și care „poluează” rezultatul a fost denumit „prăbușirea modelului”. Cercetătorii atrag atenția că fenomenul  ar putea fi tot mai frecvent, pe măsură ce sistemele IA sunt utilizate din ce în ce mai des pe internet.

Acest fenomen apare deoarece, pe măsură ce aceste sisteme produc date și sunt antrenate pe ele, părțile mai puțin uzuale ale datelor tind să fie omise. Cercetătoarea Emily Wenger, care nu a lucrat la studiu, a folosit exemplul unui sistem antrenat cu imagini ale diferitelor rase de câini: dacă există mai mulți golden retrieveri în datele originale, sistemul va alege acele imagini și, pe măsură ce procesul continuă, celelalte rase vor fi în cele din urmă omise complet - înainte ca sistemul să cedeze și să genereze doar nonsensuri.

Același efect se petrece cu modelele mari de limbaj, cum ar fi cele care alimentează ChatGPT de la OpenAI și Gemini de la Google, au mai descoperit cercetătorii.

Asta  ar putea fi o problemă nu numai pentru că sistemele devin inutile, dar și deoarece vor ajunge treptat mai puțin diverse în rezultatele generate. Pe măsură ce datele sunt produse și reciclate, sistemele ar putea să nu mai reflecte toată varietatea lumii, iar grupurile mai mici sau perspectivele diferite ar putea fi complet șterse.

Problema „trebuie luată în serios, dacă dorim să menținem beneficiile antrenării din date la scară largă preluate din online”, scriu cercetătorii, în lucrarea lor. Totodată, asta ar putea însemna că acele companii care au preluat deja date pentru a-și antrena sistemele IA ar putea fi într-o poziție avantajoasă, fiindcă datele preluate anterior vor avea mai mult conținut uman autentic în ele.

Problema ar putea fi rezolvată în mai multe feluri, inclusiv prin marcarea rezultatului, astfel încât acesta să poată fi identificat de sistemele automate și apoi filtrat din seturile de antrenare. Dar este ușor să elimini aceste marcaje și companiile de IA au fost reticente să coopereze pentru a le utiliza.

Studiul „Prăbușirea modelelor IA, atunci când sunt antrenate pe date generate recursiv” este publicat în Nature.

 

Președintele Statelor Unite, Joe Biden, urmează să se întâlnească, joi, cu prim-ministra Suediei și cu președintele Finlandei pentru a discuta despre aderarea celor două țări la Alianța Nord-Atlantică, relatează Reuters.

Economie 2022-05-20 10:02:00

Comisia Europeană a convenit cu România doar prelungirea, până la 31 ianuarie 2025, a termenului limită până la care ţara poate depune planul său de reducere a deficitului bugetar, a explicat miercuri, pentru Reuters, un purtător de cuvânt de la executivul european.

Economie 2024-10-16 15:40:48

Ministrul de Interne Cătălin Predoiu a spus la reuniunea PNL în care a fost validată candidatura lui Crin Antonescu la prezidențiale că potențialul rival al acestuia, Călin Georgescu, vorbeşte despre pace, dar se întâlneşte cu simpatizanţi legionari, care ulterior pun la cale violenţe în România. Predoiu l-a numit pe Georgescu „guru expirat, care dă senzaţia că a ieşit din fabricile de spioni din anii 80”.

Economie 2025-01-26 17:26:32

Cel mai lung tunel rutier și feroviar din lume este construit pe sub Marea Baltică și măsoară 18 kilometri. Regele Frederik al X-lea al Danemarcei a inaugurat recent primul element de construcție al viitorui tunel feroviar care va lega cele două țări, scrie CNN.

Economie 2024-06-26 00:35:32

Linda Evangelista, unul dintre cele mai cunoscute top-modele din anii '90, a dezvăluit într-un interviu acordat publicaţiei The Wall Street Journal că a supravieţuit în ultimii cinci ani la două episoade de cancer la sân.

Economie 2023-09-06 12:58:48

Partidele politice, alianţele, organizaţiile cetăţenilor aparţinând minorităţilor naţionale şi candidaţii independenţi vor putea, începând de marţi până pe 30 aprilie, ora 23,59, să depună la birourile electorale candidaturile pentru alegerile pentru autorităţile administraţiei publice locale din 9 iunie.

Economie 2024-04-15 17:42:27

Subiectele la Limba română de la Bac 2024 au fost publicate în secțiunea specială de pe edu.ro, unde este disponibil și baremul de corectare. Probele scrise de la Bacalaureat 2024 au început astăzi, 1 iulie, cu examenul la Limba română, cel care le ridică mereu cele mai mari probleme absolvenților de liceu, potrivit calendarului stabilit de Ministerul Educației. Subiectele și baremul pot fi consultate și pe digi24.ro. În jurul orei 10.00, pe rețelele sociale au apărut fotografii cu o parte din subiecte.

Economie 2024-07-01 15:20:32

Reprezentanţii Primăriei Sectorului 4 au transmis că edilul Daniel Băluţă şi cei de la Consiliul Judeţean Giurgiu vor semna, în câteva zile, primele documente pentru construirea unui aeroport în zona de sud a Capitalei. Aeroportul va fi unul internaţional şi mai mare decât cel mai nou construit în România, cel de la Braşov, întrucât ar urma să deservească un număr mai mare de judeţe, cu o populaţie mai mare.

Economie 2023-09-21 15:57:09