May 18, 2025
AI news

Alphaevolve: Hapi themelor i Google Deepmind drejt AGI

Alphaevolve: Hapi themelor i Google Deepmind drejt AGI

Google Deepmind ka zbuluar Alphaevolve, një agjent kodimi evolucionar i krijuar për të zbuluar në mënyrë autonome algoritme të reja dhe zgjidhje shkencore. Paraqitur në punimin e titulluar Alphaevolve: Një agjent kodimi për zbulimin shkencor dhe algoritmik Ky hulumtim paraqet një hap themelor drejt Inteligjencës së Përgjithshme Artificiale (AGI) dhe madje edhe mbikëqyrjes artificiale (ASI). Në vend që të mbështetet në të dhënat statike të rregullimit të imët ose të etiketuar nga njeriu, Alphaevolve merr një rrugë krejtësisht të ndryshme-ajo që përqendrohet në krijimtarinë autonome, inovacionin algoritëm dhe vetë-përmirësimin e vazhdueshëm.

Në zemër të Alphaevolve është një tubacion evolucionar i vetë-përmbajtur i mundësuar nga modele të mëdha gjuhësore (LLM). Ky tubacion nuk gjeneron vetëm rezultate – ajo mutaton, vlerëson, zgjedh dhe përmirëson kodin midis brezave. Alphaevolve fillon me një program fillestar dhe e rafinon përsëritëse atë duke prezantuar ndryshime të strukturuara me kujdes.

Këto ndryshime marrin formën e modifikimeve të kodeve të ndryshuara të gjeneruara nga LLM, të sugjeruara nga një model gjuhësor bazuar në shembuj paraprake dhe udhëzime të qarta. Një ‘dif’ në inxhinierinë e softuerit i referohet ndryshimit midis dy versioneve të një skedari, zakonisht duke theksuar linjat që duhet të hiqen ose zëvendësohen dhe të shtohen linjat e reja. Në Alphaevolve, LLM gjeneron këto ndryshime duke analizuar programin aktual dhe duke propozuar redaktime të vogla – duke shtuar një funksion, duke optimizuar një lak, ose duke ndryshuar një hiperparametër – bazuar në një shpejtë që përfshin metricat e performancës dhe redaktimet paraprake të suksesshme.

Programdo program i modifikuar testohet më pas duke përdorur vlerësues të automatizuar të përshtatur për detyrën. Kandidatët më efektivë ruhen, referohen dhe rekombinohen si frymëzim për përsëritjet e ardhshme. Me kalimin e kohës, kjo lak evolucionar çon në shfaqjen e algoritmeve gjithnjë e më të sofistikuar – shpesh duke i tejkaluar ato të dizajnuara nga ekspertët njerëzorë.

Kuptimi i shkencës pas alfaevolve

Në thelb të saj, Alphaevolve është ndërtuar mbi parimet e llogaritjes evolucionare – një nënfushë e inteligjencës artificiale të frymëzuar nga evolucioni biologjik. Sistemi fillon me një zbatim themelor të kodit, të cilin e trajton si një “organizëm fillestar”. Përmes brezave, alfaevolve modifikon këtë kod-duke përfshirë ndryshimet ose “mutacionet” dhe vlerëson aftësinë e secilit ndryshim duke përdorur një funksion të përcaktuar mirë të pikëve. Variantet me performancë më të mirë mbijetojnë dhe shërbejnë si shabllone për gjeneratën e ardhshme.

Ky lak evolucionar është i koordinuar përmes:

  • Kampionimi i shpejtë: Alphaevolve ndërton nxitje duke zgjedhur dhe ngulitur mostrat e kodit më parë të suksesshëm, metricat e performancës dhe udhëzimet specifike të detyrave.
  • Mutacioni dhe propozimi i kodit: Sistemi përdor një përzierje të LLM -ve të fuqishme – Gemini 2.0 Flash dhe Pro – për të gjeneruar modifikime specifike në bazën e kodit aktual në formën e Diffs.
  • Mekanizmi i vlerësimit: Një funksion i automatizuar i vlerësimit vlerëson performancën e secilit kandidat duke ekzekutuar atë dhe duke kthyer rezultate skalare.
  • Baza e të dhënave dhe kontrolluesi: Një kontrollues i shpërndarë orkestron këtë lak, ruajtja e rezultateve në një bazë të dhënash evolucionare dhe ekuilibrimi i eksplorimit me shfrytëzim përmes mekanizmave si Elitet MAP.

Ky proces evolucionar i pasur me reagime, i automatizuar ndryshon në mënyrë rrënjësisht nga teknikat standarde të rregullimit të mirë. Ai fuqizon alfaevolve për të gjeneruar zgjidhje romane, me performancë të lartë dhe nganjëherë kundërintuitive-duke shkatërruar kufirin e asaj që mësimi i makinerisë mund të arrijë në mënyrë autonome.

Krahasimi i alfaevolve me RLHF

Për të vlerësuar inovacionin e Alphaevolve, është e rëndësishme ta krahasoni atë me mësimin e përforcimit nga reagimet njerëzore (RLHF), një qasje mbizotëruese e përdorur për të rregulluar modele të mëdha gjuhësore.

Në RLHF, preferencat njerëzore përdoren për të trajnuar një model shpërblimi, i cili udhëzon procesin e të mësuarit të një LLM përmes algoritmeve të mësimit të përforcimit si optimizimi i politikës proksimale (PPO). RLHF përmirëson përafrimin dhe dobinë e modeleve, por kërkon përfshirje të gjerë njerëzore për të gjeneruar të dhëna për reagime dhe zakonisht funksionon në një regjim statik, një herë të rregullimit të mirë.

Në të kundërt, alfaevolve, në të kundërt:

  • Heq reagimet njerëzore nga lak në favor të vlerësuesve të ekzekutueshëm të makinerive.
  • Mbështet mësimin e vazhdueshëm përmes zgjedhjes evolucionare.
  • Eksploron hapësira shumë më të gjera të zgjidhjes për shkak të mutacioneve stokastike dhe ekzekutimit asinkron.
  • Mund të gjenerojnë zgjidhje që nuk janë thjesht të lidhura, por roman dhe shkencërisht domethënëse.

Ku sjellja e rregullave të rregullta RLHF, alfaevolve zbulon dhe shpik. Ky dallim është kritik kur merret parasysh trajektoret e ardhshme drejt AGI: Alphaevolve nuk bën vetëm parashikime më të mira – gjen shtigje të reja drejt së vërtetës.

Aplikimet dhe përparimet

1. Zbulimi algoritmik dhe përparimet matematikore

Alphaevolve ka demonstruar aftësinë e tij për zbulime themelore në problemet thelbësore të algoritmikut. Më e rëndësishmja, ajo zbuloi një algoritëm të ri për shumëzimin e dy matricave me vlera komplekse 4 × 4 duke përdorur vetëm 48 shumëzime skalare-duke e mërzitur rezultatin e Strassen në 1969 të 49 shumëzimeve dhe thyer një tavan teorik 56-vjeçar. Alphaevolve e arriti këtë përmes teknikave të përparuara të dekompozimit të tenzorit që evoluoi në shumë përsëritje, duke tejkaluar disa qasje më të mira.

Përtej shumëzimit të matricës, Alphaevolve dha kontribute të konsiderueshme në kërkimet matematikore. Ajo u vlerësua në mbi 50 probleme të hapura nëpër fusha të tilla si kombinatorika, teoria e numrave dhe gjeometria. Ajo përputhej me rezultatet më të njohura në afërsisht 75% të rasteve dhe i tejkaloi ato në rreth 20%. Këto suksese përfshinin përmirësime në problemin minimal të mbivendosjes së ERDős, një zgjidhje më të dendur për problemin e numrit të puthjes në 11 dimensione dhe konfigurimet më efikase të paketimit gjeometrik. Këto rezultate nënvizojnë aftësinë e tij për të vepruar si një eksplorues autonome matematikore – duke rafinuar, përsëritur dhe evoluuar zgjidhje gjithnjë e më optimale pa ndërhyrje njerëzore.

2. Optimizimi në të gjithë Stack Compute të Google

Alphaevolve ka dhënë gjithashtu përmirësime të prekshme të performancës në të gjithë infrastrukturën e Google:

  • Brenda caktimi i qendrës së të dhënavezbuloi një heuristic të ri që përmirësoi vendosjen e punës, duke rikuperuar 0.7% të burimeve të llogaritura më parë.
  • Për Kernelet e Trajnimit të BinjakëveAlphaevolve hartoi një strategji më të mirë të pllakave për shumëzimin e matricës, duke dhënë një shpejtësi 23% të kernelit dhe një ulje të përgjithshme 1% të kohës së trajnimit.
  • Brenda Dizajni i qarkut TPUajo identifikoi një thjeshtësim të logjikës aritmetike në RTL (niveli i transferimit të regjistrit), i verifikuar nga inxhinierët dhe i përfshirë në çipat TPU të gjeneratës tjetër.
  • Gjithashtu optimizuar Kodi i Flashatimit të gjeneruar nga përpiluesi Me redaktimin e përfaqësimeve të ndërmjetme XLA, duke shkurtuar kohën e konkluzionit në GPU me 32%.

Së bashku, këto rezultate vërtetojnë aftësinë e Alphaevolve për të operuar në nivele të shumta abstraksioni-nga matematika simbolike deri tek optimizimi i nivelit të ulët të harduerit-dhe ofrimi i fitimeve të performancës në botë reale.

  • Programimi evolucionar: Një paradigmë e AI duke përdorur mutacionin, përzgjedhjen dhe trashëgiminë për të rafinuar në mënyrë përsëritëse zgjidhjet.
  • Kodi Superoptimization: Kërkimi i automatizuar për zbatimin më efikas të një funksioni – shpesh duke dhënë përmirësime befasuese, kundërintuitive.
  • Meta e shpejtë evolucioni: Alphaevolve nuk evoluon vetëm kodin; Ai gjithashtu evoluon se si komunikon udhëzimet për LLM-të-duke u mundësuar vetë-rafinimit të procesit të kodimit.
  • Humbja e diskretizimit: Një term rregullimi i rezultateve inkurajuese për tu lidhur me vlerat gjysmë të plota ose të plotë, kritike për qartësinë matematikore dhe simbolike.
  • Humbja e halucinimit: Një mekanizëm për të injektuar rastësi në zgjidhje të ndërmjetme, duke inkurajuar eksplorimin dhe duke shmangur minimumet lokale.
  • Algoritmi i hartave-eliteve: Një lloj i algoritmit të diversitetit të cilësisë që mban një popullsi të larmishme të zgjidhjeve me performancë të lartë në të gjithë dimensionet e tipareve-duke mundësuar inovacionin e fortë.

Implikimet për AGI dhe ASI

Alphaevolve është më shumë se një optimizues – është një paraqitje e shkurtër në një të ardhme ku agjentët inteligjentë mund të demonstrojnë autonomi krijuese. Aftësia e sistemit për të formuluar probleme abstrakte dhe për të hartuar qasjet e veta për zgjidhjen e tyre paraqet një hap të rëndësishëm drejt inteligjencës së përgjithshme artificiale. Kjo shkon përtej parashikimit të të dhënave: Ai përfshin arsyetimin e strukturuar, formimin e strategjisë dhe përshtatjen me reagimet – tregimet e sjelljes inteligjente.

Kapaciteti i tij për të gjeneruar dhe rafinuar në mënyrë përsëritëse hipotezat gjithashtu sinjalizon një evolucion në mënyrën se si mësojnë makinat. Për dallim nga modelet që kërkojnë trajnim të gjerë të mbikëqyrur, Alphaevolve përmirësohet vetë përmes një lak të eksperimentimit dhe vlerësimit. Kjo formë dinamike e inteligjencës i lejon asaj të lundrojë në hapësirat komplekse të problemeve, të heqë zgjidhje të dobëta dhe të lartësojë ato më të forta pa mbikëqyrje të drejtpërdrejtë njerëzore.

Duke ekzekutuar dhe vërtetuar idetë e veta, Alphaevolve funksionon si teoricien dhe eksperimentalist. Ajo lëviz përtej kryerjes së detyrave të paracaktuara dhe në fushën e zbulimit, duke simuluar një proces shkencor autonome. Improvementdo përmirësim i propozuar është testuar, krahasuar dhe ri-integruar-duke e dhënë për rafinim të vazhdueshëm bazuar në rezultate reale sesa në objektiva statike.

Ndoshta më e rëndësishmja, Alphaevolve është një shembull i hershëm i vetë-përmirësimit rekursiv-ku një sistem AI jo vetëm që mëson, por rrit përbërësit e vetvetes. Në disa raste, Alphaevolve përmirësoi infrastrukturën e trajnimit që mbështet modelet e veta të fondacionit. Edhe pse ende kufizohet nga arkitekturat aktuale, kjo aftësi vendos një precedent. Me më shumë probleme të krijuara në mjedise të vlerësueshme, Alphaevolve mund të shkojë drejt sjelljes gjithnjë e më të sofistikuar dhe vetë-optimizuese-një tipar themelor i mbikëqyrjes artificiale (ASI).

Kufizimet dhe trajektorja e ardhshme

Kufizimi aktual i Alphaevolve është varësia e tij nga funksionet e automatizuara të vlerësimit. Kjo kufizon dobinë e saj ndaj problemeve që mund të zyrtarizohen matematikisht ose algoritmikisht. Ende nuk mund të funksionojë në mënyrë të konsiderueshme në fushat që kërkojnë mirëkuptim të qetë njerëzor, gjykim subjektiv ose eksperimentim fizik.

Sidoqoftë, udhëzimet e ardhshme përfshijnë:

  • Integrimi i vlerësimit hibrid: Kombinimi i arsyetimit simbolik me preferencat njerëzore dhe kritikat në gjuhën natyrore.
  • Vendosja në mjediset e simulimit, duke mundësuar eksperimentimin e mishëruar shkencor.
  • Distilimi i rezultateve të evoluara në LLMS Base, duke krijuar modele më të afta dhe më të efektshme të fondacionit.

Këto trajektore tregojnë drejt sistemeve gjithnjë e më agjentë të afta për zgjidhjen e problemeve autonome, me interes të lartë.

Përfundim

Alphaevolve është një hap i thellë përpara – jo vetëm në mjetet e AI, por në të kuptuarit e vetë inteligjencës së makinerisë. Duke bashkuar kërkimin evolucionar me arsyetimin dhe reagimet e LLM, ajo ripërcakton atë që makinat mund të zbulojnë në mënyrë autonome. Shtë një sinjal i hershëm, por domethënës që sistemet vetë-përmirësuese të afta për mendimin e vërtetë shkencor nuk janë më teorike.

Duke parë përpara, arkitektura që nënvizon alfaevolve mund të zbatohet në mënyrë rekursive në vetvete: evoluimi i vlerësuesve të vet, përmirësimi i logjikës së mutacionit, rafinimi i funksioneve të pikëve dhe optimizimi i tubacioneve themelore të trajnimit për modelet nga të cilat varet. Kjo lak optimizimi rekursiv paraqet një mekanizëm teknik për bootstrapping drejt AGI, ku sistemi nuk ka thjesht detyra të plota, por përmirëson vetë infrastrukturën që mundëson mësimin dhe arsyetimin e tij.

Me kalimin e kohës, pasi alfaevolve peshojnë nëpër fusha më komplekse dhe abstrakte – dhe si ndërhyrja njerëzore në proces zvogëlohet – mund të shfaqë përfitime të përshpejtuara të inteligjencës. Ky cikël vetë-përforcues i përmirësimit iterativ, i aplikuar jo vetëm për problemet e jashtme, por nga brenda në strukturën e vet algoritmike, është një përbërës kryesor teorik i AGI dhe të gjitha përfitimet që mund t’i sigurojë shoqërisë. Me përzierjen e tij të krijimtarisë, autonomisë dhe rekursionit, alfaevolve mund të mbahet mend jo thjesht si një produkt i DeepMind, por si një plan për mendjet artificiale të parë me të vërtetë të përgjithshme dhe të vetë-zhvilluara.

(Tagstotranslate) AGI (T) Alphaevolve (T) ASI (T) DeepMind

Leave feedback about this

  • Quality
  • Price
  • Service

PROS

+
Add Field

CONS

+
Add Field
Choose Image
Choose Video