sajtó csomag
SAJTÓKAPCSOLAT
Tel: +36 1 457 0561
Fax: +36 1 457 0562
Cím: 1115 Budapest,
Bartók Béla út 105-113.
A tapasztalat korszaka
A tapasztalat korszaka
A tapasztalati korszak: amikor az MI túllép az emberin
Az MIT Press hamarosan megjelenő Designing an Intelligence című könyvéből már olvasható egy figyelemreméltó előzetes fejezet, amelyben David Silver és Richard S. Sutton a mesterséges intelligencia következő nagy korszakváltását vázolják fel. (A szerzők egyébként nem kispályások: David Silver a Google DeepMind kutatója, aki az AlphaGo, AlphaZero és több más forradalmi MI-rendszerek fejlesztésében játszott kulcsszerepet, míg Richard S. Sutton az Andrew G. Barto-val közösen írt Reinforcement Learning: An Introduction című, a megerősítéses tanulás bibliájának számító mű társszerzője.)
Miközben még ki sem hevertük a generatív MI adatközpontokat és emberi kreativitást megrengető hatásait, a szerzők szerint már a küszöbön áll valami sokkal radikálisabb változás: az „Era of Experience", vagyis a tapasztalati korszak.
Ami nem látszik messziről: a nagy nyelvi modellek korlátai
A jelenlegi generatív mesterséges intelligencia forradalom elsősorban az emberi adatokon, tudáson alapul. Gondoljunk csak a nagy nyelvi modellekre, amelyek döbbenetesen sokféle feladatot képesek elvégezni – verseket írnak, fizikai problémákat oldanak meg, orvosi diagnózisokat állítanak fel vagy jogi dokumentumokat összegeznek. Ez a hatékony "utánzás" azonban egyre inkább közeledik a határaihoz.
A szerzők rámutatnak, hogy bár a ChatGPT, Claude és társaik kétségtelenül lenyűgözőek, az emberi adatok imitálása önmagában nem elegendő a valódi, szuperhumán intelligencia eléréséhez. A matematika, kódolás, tudomány területén az emberi adatokból kinyerhető tudás gyorsan közelít egy felső határhoz. A minőségi adatforrások, amelyek ténylegesen javíthatnák egy erős modell teljesítményét, lassan kimerülnek. A kizárólag felügyelt tanulásból származó fejlődés üteme kimutathatóan lassul, ami új megközelítésre utal. Ráadásul az igazán értékes új felismerések – tegyük hozzá: új tételek, technológiák, tudományos áttörések – túlmutatnak a jelenlegi emberi megértés határain, és nem szerepelnek a meglévő adatokban. (Ez persze vitatható, elég, ha csak a nemrégiben bemutatott Microsoft Discovery demójára vagy a Sakura AI által elfogadott tudományos cikkre gondolunk).
Élet a statikus adatkorszak után
A részletben körvonalazott új paradigma kulcsa, hogy az ágensek saját tapasztalataikból tanulnak, folyamatosan fejlődve, ahogy interakcióba lépnek környezetükkel. Az adatok nem statikusak, hanem az ágens és környezete közötti kölcsönhatásokból jönnek létre, így biztosítva, hogy folyamatosan javuljon a teljesítmény.
A tapasztalati korszak négy alapvető jellemzővel bír:
Folyamatosság: az ágensek rövid interakciók helyett folyamatos tapasztalati „áramlásokban” léteznek: információjuk átível az egész adatfolyamon, viselkedésük pedig adaptálódik a múltbeli tapasztalatokhoz. Képzeljünk el egy egészségügyi tanácsadó ágensét, amely nem csak válaszol egy konkrét kérdésre, hanem hónapokon át figyeli a felhasználó alvási szokásait, táplálkozását és aktivitását, majd ennek megfelelően alakítja tanácsait.
Valóságba ágyazottság: az ágensek cselekvései és megfigyelései közvetlenül a környezetből származnak, nem csak emberi párbeszédekből. A nyelvmodellekhez integrált cselekvési képességek – kódfuttatás, eszközhasználat – már most is lehetővé teszik, hogy az MI autonóm módon fedezze fel a világot. A DeepSeek és OpenAI o3 modelljei látványosan mutatják ennek kezdeteit.
Közvetlen visszajelzés: a jutalmak nem emberi előítéletekből, hanem közvetlenül a környezetből származnak. Ahol az emberi értékelők hajlamosak saját határaik szerint ítélni, a környezeti visszajelzések (legyen az szívritmus, vizsgaeredmény vagy szén-dioxid-szint) objektív mércét jelentenek.
Nem-emberi gondolkodás: bár az LLM-ek képesek emberi nyelven "gondolkodni", ez valószínűleg nem a legjobb számítási forma. Hatékonyabb mechanizmusok létezhetnek, amelyek nem emberi nyelveket használnak, például szimbolikus, elosztott, folytonos vagy differenciálható számításokat.
„Winds of Change”
Ezt a paradigmaváltást már jelzi az AlphaProof sikere, amely először szerzett érmet a Nemzetközi Matematikai Olimpián, túlszárnyalva a tisztán emberi adatokon alapuló módszereket. A rendszer kezdetben emberi matematikusok által létrehozott, mintegy százezer formális bizonyítással indult, majd megerősítéses tanulási algoritmusával saját tapasztalatain keresztül további százmillió formális bizonyítást generált. Ez lehetővé tette számára, hogy olyan területeket fedezzen fel, amelyek túlmutatnak a meglévő tudáson.
Mire számíthatunk?
A cikk kijózanító figyelmeztetéssel szolgál: miközben a tapasztalati tanulás precedens nélküli képességeket ígér, például a tudományos felfedezések felgyorsítását, személyre szabott asszisztenseket, autonóm kísérletező rendszereket, addig jelentős kihívásokat is jelent. Az emberi képességek automatizálása munkahelyek megszűnéséhez vezethet, és az ágensek korábban kizárólag emberi tulajdonságnak vélt képességeket mutathatnak, mint a hosszú távú problémamegoldás vagy az innováció.
A kockázatok mellett azonban olyan előnyöket is hozhat ez a korszak, amelyek ellensúlyozhatják ezen kockázatok némelyikét, akár váratlan módokon is. A tapasztalati ágensek tudatában vannak környezetüknek, és viselkedésük idővel alkalmazkodhat a változásokhoz, ellentétben bármely előre programozott rendszerrel. Képesek lehetnek megfigyelni a hardverhibákat, alkalmazkodni a gyors társadalmi változásokhoz, vagy befogadni és építeni az új tudományos eredményekre. Ami talán még fontosabb: felismerhetik, ha viselkedésük emberi aggodalmat, elégedetlenséget vagy szorongást vált ki, és adaptívan módosíthatják magatartásukat.
Hogyan készüljünk fel?
A tapasztalati korszak megköveteli, hogy újragondoljuk az MI-vel való kapcsolatunkat. Többé nem eszközökként, hanem partnereinkként érdemes tekintenünk ezekre a rendszerekre – olyanokként, amelyek velünk együtt fedezik fel a világot, és idővel tanulnak belőle.
A technológiai adaptációs stratégiáink alapjait is meg kell változtatnunk. A jövő győztesei talán épp azok lesznek, akik nemcsak használják, hanem aktívan formálják is ezeket a tapasztalati ágenseket: meghatározva, hogy milyen környezetben működjenek, milyen visszajelzéseket kapjanak, és hogyan segítsék munkánkat és életünket.
Az új paradigma komoly etikai és szabályozási kérdéseket is felvet, azonban a tapasztalati korszak már megkezdődött, akár készen állunk rá, akár nem. A kérdés már nem az, hogy ez a változás bekövetkezik-e, hanem hogy hogyan formáljuk a lehető leginkább emberközpontúvá, miközben kiaknázzuk a benne rejlő példátlan lehetőségeket.
-
Rövid animációs film Hangáról
-
Rövid animációs film Hangáról