sajtó csomag
SAJTÓKAPCSOLAT
Tel: +36 1 457 0561
Fax: +36 1 457 0562
Cím: 1115 Budapest,
Bartók Béla út 105-113.
A Stanford AI Index néhány tanulsága
A Stanford AI Index néhány tanulsága
Tele vagyunk mérőszámokkal. Elöntenek minket a benchmarkok, különösen a generatív MI-k kapcsán, ember legyen a talpán, aki naprakész tud maradni az újabb és újabb SOTA-modellek teljesítményében. El is veszünk a részletekben, ha csak ezekre figyelünk… Éppen ezért üdítő és hasznos minden olyan elemzés, amely kicsit helikopternézetből vizsgálja az MI általános állapotát. Ilyen a Stanford Egyetem AI Index dokumentuma, amely szabadon hozzáférhető ezen a linken.
Ez a cikk a jelentés legfontosabb megállapításait összegzi, három kulcsfontosságú szempont – technológiai, társadalmi és világpolitikai – mentén.
Útikalauz MI-stopposoknak
A Stanford Egyetem Emberközpontú Mesterséges Intelligencia Intézetének (HAI) évente megjelenő AI Index jelentése pont olyan, amit az ember elvárhat az MI történelmében is jelentős intézménytől. Az idei, sorrendben nyolcadik, 2025-ös kiadás az eddigi legátfogóbb darab, és célja, hogy döntéshozókat, kutatókat, újságírókat és a szélesebb közönséget ellássa szigorúan ellenőrzött, globálisan gyűjtött adatokkal az MI világáról.
Így készült a jelentés
A 455 oldalas jelentés többek között tudományos publikációkat, szabadalmakat, vállalati beruházási adatokat, benchmark-teszteket, közvélemény-kutatásokat és szakpolitikai dokumentumokat elemez, hogy átfogó és megbízható képet adjon az MI aktuális állapotáról és trendjeiről. Saját bevallásuk szerint az idei jelentés eddig a legátfogóbb a kiadványuk történetében – jó példa erre, hogy idén már a 260 milliónyi kutatási publikáció adatait tartalmazó OpenAlex adatbázist is forrásként használták.
Az idei jelentés újdonságai közé tartoznak ezen kívül: az MI hardverek fejlődésének mélyebb elemzése, az inferencia (következtetési) költségek becslése, valamint a felelős MI gyakorlatok vállalati adaptációjának vizsgálata.
Nem hype, nincs lassítás
A jelentés egyik legmarkánsabb megállapítása az MI-rendszerek folyamatos és gyorsuló teljesítményjavulása, még a legnehezebb mérési pontokon is. Az olyan új, kihívást jelentő benchmarkokon, mint az MMMU, GPQA és SWE, amelyeket kifejezetten a fejlett MI-k képességeinek határainak tesztelésére hoztak létre 2023-ban, a modellek teljesítménye egyetlen év alatt drámaian nőtt. Ez a gyors fejlődés azt mutatja, hogy az MI képességei rohamosan bővülnek, ami új alkalmazási lehetőségeket nyit meg, de egyben a meglévő értékelési módszerek gyors elavulását is jelenti. (A szakmai felületeken egyre sürgetőbben kommunikálják iparági szereplők az új, a helyzethez igazított benchmarkok létrehozását.)
Ezzel párhuzamosan az MI egyre hatékonyabbá és hozzáférhetőbbé válik. Kisebb, de rendkívül hatékony modellek jelennek meg, és az MI-modellek használatának (inferencia) költségei drasztikusan csökkennek. Például egy GPT-3.5 szintű teljesítményt nyújtó modell lekérdezésének költsége kevesebb mint két év alatt a 280-ad részére csökkent. Ez a trend, kiegészülve a nyílt súlyú (open-weight) modellek felzárkózásával a zárt rendszerekhez képest, demokratizálja a hozzáférést a fejlett MI-technológiákhoz, csökkentve a belépési korlátokat a fejlesztők és a vállalkozások számára.
A kínai DeepSeek sikere (és árszabása) bebizonyította, hogy ádáz versenytársat jelentenek a nyílt modellek a zártakhoz képest – és az igazi csata csak most következik.
Szeretlek is meg nem is
Közhely, hogy az MI (különösen a mély tanulás és a generatív) egyre jobban beépül az egyén és a vállalatok életébe. A jelentés is megerősíti, hogy az MI növeli a termelékenységet, és sok esetben segít csökkenteni a képzettségbeli különbségeket a munkaerőpiacon. A vállalati szféra is teljes mellszélességgel az MI felé fordult, rekordmértékű beruházásokkal és felhasználási arányokkal.
Egy másik trend szintén kirajzolódik a jelentésből: ez pedig a társadalmi elfogadottság kérdése. Míg globálisan nő az optimizmus az MI potenciális előnyeivel kapcsolatban, jelentős regionális különbségek és komoly bizalmi problémák figyelhetők meg. Kevesebben bíznak abban, hogy az MI-cégek megvédik adataikat, és továbbra is aggályok merülnek fel a méltányossággal és az algoritmikus torzítással kapcsolatban. A felelős MI (RAI, azaz Responsible AI) ökoszisztémája lassan, de egyenetlenül fejlődik: miközben nő az ismertté vált MI-incidensek száma, a sztenderdizált RAI értékelések még ritkák, bár a kormányzati figyelem és a nemzetközi együttműködés erősödik.
USA vs. Kína
Az MI fejlesztése egyre inkább geopolitikai versenytérré válik. Bár az Egyesült Államok továbbra is vezető szerepet tölt be a legjelentősebb modellek fejlesztésében, Kína gyorsan zárkózik fel a modellek teljesítményét illetően, és már most vezető szerepet tölt be a publikációk és szabadalmak terén (miközben persze az amerikai szisztéma a maga meritokratikus nyersességével hatékonyabbnak tűnik). Ez a dinamika átformálhatja a globális technológiai erőviszonyokat. És akkor még nem is beszéltünk a chipgyártás körüli gazdasági háborúról…
Erre válaszul a kormányzatok világszerte fokozzák aktivitásukat: egyrészt hatalmas összegeket fektetnek be nemzeti MI-infrastruktúrákba és kutatásba (pl. USA, Kína, Kanada, Franciaország, India, Szaúd-Arábia), másrészt egyre több szabályozást vezetnek be. Az USA-ban például 2024-ben megduplázódott az MI-vel kapcsolatos szövetségi szabályozások száma, és a tagállamok is rendkívül aktívak a törvényhozásban, különösen a deepfake-ek ellen. Ezzel párhuzamosan erősödik a nemzetközi együttműködés is az MI irányításában, globális szervezetek és nemzeti MI biztonsági intézetek hálózatai próbálnak közös elveket és normákat kialakítani.
Három meglepő adat az AI Index 2025-ből
A jelentés rengeteg adatot és trendet tár fel, amelyek közül néhány különösen meglepő lehet, vagy árnyalja az MI-ről alkotott közkeletű elképzeléseket. Példaként bemutatunk három ilyen adatot:
-
Bár az Egyesült Államok továbbra is vezető a legtöbb jelentős MI-modell létrehozásában (mennyiségileg), a minőségi különbség a csúcsmodellek között drámaian csökkent Kínával szemben. Míg 2023 végén a vezető amerikai modellek jelentős, néha 10% feletti előnnyel rendelkeztek olyan kulcsfontosságú benchmarkokon, mint az MMLU, MATH vagy HumanEval, 2024 végére ezek a különbségek szinte teljesen eltűntek, néhány esetben csupán tizedszázalékokra zsugorodtak.
-
Az MI fejlődését gyakran a modellek paraméterszámának növekedésével azonosítják, de a jelentés egy meglepő fordulatra hívja fel a figyelmet: egyre kisebb modellmérettel is elérhetők korábban csak óriási rendszerekre jellemző teljesítményszintek. Például míg 2022-ben a legkisebb, 60% feletti MMLU benchmark-eredményt elérő modell a Google PaLM 540 milliárd paraméterrel rendelkezett, 2024-re már a Microsoft Phi-3-mini – mindössze 3,8 milliárd paraméteres modellel – teljesítette ezt a szintet, ami több mint 140-szeres méretcsökkenést jelent.
-
A mesterséges intelligencia forradalmasítja a tudományos felfedezéseket, különösen az élettudományokban, az AlphaFold fehérjehajtogatási áttörésétől egészen a Nobel-díjakig. Ezzel az MI új korszakot nyithat az orvosbiológiai kutatásban és az egészségügyben. Ha az örökélet egyelőre még nincs is karnyújtásnyira, a felgyorsult fejlődésnek hála belátható közelségbe került számos komoly betegség legyőzése.
Szép új világ…?
A Stanford HAI 2025-ös AI Index jelentése ismételten alátámasztja, hogy a mesterséges intelligencia fejlődése exponenciális ütemben halad, és alapvetően formálja át világunkat. Lassulásnak semmi jele, sőt: érdemes lesz egy év múlva figyelni a következő Stanford AI Indexet.
-
RÖVIDHÍR KOMMENTÁRRAL - MESTERSÉGES ÉRZELMI INTELLIGENCIA?
-
RÖVIDHÍR KOMMENTÁRRAL - MESTERSÉGES ÉRZELMI INTELLIGENCIA?