Ki írta a regényedet? - MI az irodalomban

Iparág: Biztosítás

A mesterséges intelligencia sok ember számára már most is a science fiction kategóriájába tartozik. Apropó, sci-fi: 2023 januárjában az egyik leghíresebb fantasztikus irodalmi magazin, az Asimov’s szerkesztője kapott egy „Az utolsó remény” című kéziratot. Azután néhány hét múlva (újra) egy másik embertől egy ugyanolyan címűt, majd újabb és újabb szerzőktől jött be ugyanaz a cím. Átlagosan 700-750 kézirat érkezik a szerkesztőségbe, de ez a szám 2023 első hónapjaiban felkúszott 1000-re. Az ok szó szerint prózai: a sci-fi prózákat elkezdték a reménybeli írók a ChatGPT-vel megíratni, és a nagy nyelvi modell nem mutatott nagy változatosságot, amikor a késztermékről volt szó. Elérkeztünk az MI generálta irodalom kapujához – vajon bemegyünk-e rajta?

Wannabe írók és az MI

A jelenség sajnos nem egyedi. A másik jelentős science fiction magazin, a Clarkesworld is belefutott az MI-szörnyszülöttek (pontosabban: unalmas, átlagos kéziratok) özönébe. A magazin szerkesztője szerint a februári termés: 700 emberi, és 500 géppel „segített” szöveg. Kik lehetnek azok, akik így próbálnak betörni az amúgy nagyon magas színvonalú elvárásokat támasztó magazinokba? Olyanok, akik gyors pénzkereseti vagy másodállásban az MI-vel könnyen összehozható mellékjövedelmet látnak a ChatGPT és társai alkalmazásában. Szerencsére, az emberi szerkesztőket még nem lehet átverni, hiszen óriási szakadék tátong az emberi és a szoftveres műalkotások között. De ez a szakadék egyre szűkül.

Irodalom végveszélyben?

Az írás, a szövegalkotás magától értetődően mindig is emberi tevékenységnek számított. Egy-egy közösség a kiemelkedő íróit, költőit látnokoknak, váteszeknek, zseniknek tartotta, hiszen szinte a semmiből, a gondolataik kuszaságából hoztak elő akár évszázadokra kiható irodalmi alkotásokat.

A nagy nyelvi rendszerek, mivel ilyen szerzők szövegein is „nevelkedtek”, ma már képesek stílusok utánzására, megdöbbentően emberszerű leírások, párbeszédek, strófák megírására is. Ami algoritmizálható, az nem kerülheti el a sorsát – és úgy tűnik, az irodalom is ilyen. Minél inkább egy adott zsánerben szeretne valaki írni, annál jobban használhatja a nagy nyelvi rendszereket. (A zsánerirodalom pont azért népszerű, mert jól leírható, hogy az olvasók milyen fordulatokat, helyszíneket, szereplőket várnak el az olvasmányoktól, ezek az úgynevezett zsánerszerű elemek. Zsánerirodalom például a krimi, a romantikus regény, a western irodalom, de természetesen a science fiction vagy a fantasy is.)

Persze még a legprofibbakat is eléri az MI-vész: az ugyancsak a fantasztikus irodalom zászlóshajójának számító Lightspeed magazin 2024 áprilisában volt kénytelen megkövetni olvasóit. Ennek oka, hogy az MI-generálta bárminemű tartalomtól határozottan elzárkózó folyóirat véletlenül egy MI által készített képet tett meg egy korábbi számának borítójának.

Szerzőtársat kaptunk

De mi a helyzet a technológia felé távolságtartóbbnak gondolt szépirodalom területén? Az idei Pulitzer-díjak újságírói kategóriájában a 45 döntős közül már 5 szerző használta a mesterséges intelligenciát a következő területeken: kutatás, riportkészítés. A Pulitzer döntéshozó testülete egyébként már tavaly elkezdte vizsgálni, hol húzzák meg a határvonalat, és engedjék-e a nagy nyelvi rendszerek használatát a rangos díjra nevezett írások értékelésekor. Ahogy látszik, nem utasították el a technológiát.

LaShawn M. Wanak, a GigaNotoSaurus online spekulatív magazin szerkesztője maga is író. Kipróbálta hát, hogy saját hírlevelébe milyen szöveget illeszthetne be az MI-vel, és az eredmény zavarbaejtően igazinak tűnt. Ezután megkérte a ChatGPT-t, hogy írjon egy történetet a táncoló varjakról. Meglett a sztori, de átlagos eredményt kapott – amikor viszont arra utasította a chatbotot, hogy ugyanazt írja át a világhírű fantasy szerző, Neil Gaimen stílusában, akkor „borzasztóan jónak” találta a mondatokat. Ez természetesen felveti annak a kérdését, hogy az OpenAI vajon fizetett-e az adatbázisába kerülő szövegek íróinak. Tudjuk, hogy a válasz nemleges, így hát perek sokasága következhet.

Wanak egyébként kifejtette, hogy miben gyenge az MI: ő szerkesztőként azt tanácsolja a kezdő íróknak, hogy minél előbb találják meg a saját hangjukat, és ezt nem lehet könnyen megtanítani, előhozni az emberekből. Mivel a nagy nyelvi rendszerek a statisztikailag legvalószínűbb tokeneket (szavakat, kifejezéseket) dobják fel, túl általános lesz a szöveg, az írói hang egyformává válik.

Felkészül: az újabb generáció

Az idén debütált Claude Opus chatbot viszont már képes arra, hogy akár 20 regénynyi szövegadattal „megetessük”. Így lehetővé válik, hogy egy adott író a saját szövegein tanítsa meg, és a kapott szöveg olyan lesz, mintha valóban ember írta volna. A Clio nevű alkalmazással pedig látszólag rendkívül gyorsan megírható bármilyen könyv.

Valószínűleg az ilyen társhasználat (Copilot) fog elterjedni, hiszen ez a szerzők jogát és lehetőségét nem csorbítja, hanem a teljesítményt emeli új szintre. Már csak az olvasók kellenek ahhoz, hogy eldöntsék: vevők-e az eddigiekhez képest elképzelhetetlen szövegbőséget eredményező, MI által társszerzőként jegyzett irodalmi alkotásokra.

5 kínzó kérdés a ChatGPT-vel kapcsolatban

Iparág: Biztosítás

A Microsoft által 2019-ben egymilliárd dolláros befektetéssel megtámogatott OpenAI kutatólabor publikussá tett terméke jött, látott, győzött. Mert ugyan hogyan is nevezhetnénk másképp azt a tényt, mely szerint a 2022. november 30-án a nagyközönség előtt is megnyitott ChatGPT chatbotja pár nap alatt már egymillió felhasználóra tett szert? A ChatGPT gyakorlatilag az első olyan, mesterséges intelligenciára épülő, megerősítő és felügyelt tanulással kiképzett eszköz, amely a világ kreatív és/vagy informatikával foglalkozó szakembereinek egy részében hihetetlen lelkesedést, kísérletezést váltott ki. (Ez alól természetesen más szakmák képviselői sem vonták ki magukat.)

Azóta csak kapkodjuk a fejünket, hogy mi mindenre használható a még tesztfázisban lévő algoritmus? Mivel a nem szakmai sajtó is egyre többet foglalkozik a témával, mi néhány komolyabb, a jövőt befolyásoló kérdés megválaszolásával kívánunk részt venni e diskurzusban.

5 kínzó kérdés a ChatGPT-vel kapcsolatban

Tényleg öntudatra ébredt MI-ről van szó?

Nem, ettől nagyon is távol vagyunk. A ChatGPT megdöbbentő outputja viszont épp az, hogy intelligensnek látszik. A válaszai, a megoldásai azt az erős benyomást keltik, hogy egy intelligens lény áll a válaszok mögött. Mi persze tudjuk, hogy ez nem mágia és nem varázslat: 175 milliárd szöveges paramétert (többek közt 8 millió dokumentumot és 10 milliárd szót) „etettek” meg a ChatGPT-t működtető, az OpenAI GPT-3.5 nevű algoritmusával, hogy a viszonylag gyorsan kiköpött, többnyire értelmes válaszok élethűnek tűnjenek. A mesterséges intelligenciát használó chatbot emberi visszajelzéseken alapuló megerősítő tanulásban, felügyelt finomhangolásban „vett részt”, a legújabb GPT-3 nyelvi modell (InstructGPT) pedig a cég szerint jobb válaszokat ad a felhasználók kérdéseire. Ez az egyik újdonság: a párbeszédes forma valóban intelligens lény jelenlétét árasztja a válaszokból, ráadásul a chatbot megjegyzi a beszélgetés korábbi tartalmát, így igazi dialógus jöhet létre a ChatGPT és az emberi felhasználó között.

A Microsoft erőforrásait használó ChatGPT képes arra, hogy egy ember által bevitt szövegre „kitalálja”, milyen szöveggel folytatható, kiegészítve azt, vagyis választ generál. Ezek a válaszok egyszer pontosak, máskor viszont bosszantóan pontatlanok. Az emberrel ellentétben viszont mindig magabiztosan válaszol, és az OpenAI humoros megoldásokkal is ellátta (például bocsánatot kér, ha helyreigazítjuk tárgyi tévedését).

A ChatGPT időbeli korlátja 2021 júniusa, ez után új adat nem került bele az algoritmusába (tehát 2022-es eseményekkel, adatokkal kapcsolatban ne zargassuk).

Miért lelkesek a kreatív szakemberek a chatbotot használva?

Nos, úgy tűnik, hogy minden olyan (rész)feladat, amely szöveg alapú, meggyorsítható a ChatGPT használatával. Miről is van szó? Brainstormingról, szövegírásról, és ez utóbbi minden alfajáról. Science fiction vagy éppen romantikus regényötletre vágyunk? Megírja. Ted Talk előadásra készülünk? Adjuk meg a témát, és kész a szöveg. Netán standupos babérokra törnénk? Találjuk ki a témát, és bár csetlő-botló módon, de kapunk egy alapszöveget. Hosszabb szövegnek szeretnénk a velejét megtalálni? Mi sem könnyebb ezzel.

Miért várnak visszafojtott lélegzettel a programozók?

Mivel a ChatGPT szöveg alapú, ezért programot is ír. Az első, ezzel kísérletező fejlesztők-programozók hihetetlenkedve mutatták meg a közösségi médiában a chatbot által írt programokat. Sokféle programnyelvet ismer már most is a program, és a kódokat meg is magyarázza. Úgy tűnik, a ChatGPT kitűnő eszköz egy megadott kódsor bug-jainak ellenőrzésére és fixálására is. Nem ez az első ilyen alkalmazás, amely erre képes (pl. ott a CodePilot is), de a ChatGPT-ben az a félelmetes, hogy erre is képes. Többen már azt vízionálták, hogy feleslegessé válhat a munkájuk a közeljövőben.

Jó-jó, de a ChatGPT akkor most tényleg elveszi a munkát?

Ez a helyes megfogalmazás. Bizonyos munkákat kivesz az emberek kompetenciája alól, de nem szünteti meg a munkahelyet. Mit jelent ez? Sokáig azt gondoltuk, hogy minél több kreativitás kell egy munkához, annál nehezebb lesz automatizálni. A sor elején a mezőgazdaság állt, azt gépiesítettük, majd jöttek az ipari termelőegységek, a gyárak, ahol szorgos robotkarok kerültek az emberek helyére. De hogy alkotó, értelmiségi munkaerő veszélybe kerül – ezt csak a távoli jövőben tudtuk elképzelni. Eddig.

A hatékonyság hajszolása miatt nem eretnek a gondolat, hogy kevesebb programozóra vagy tartalomgyártóra lesz szükség. A jó hír azonban az: mindig kell ember a ChatGPT és az utána jövő, hasonló megoldások működtetésére. Az ember az, aki kiadja a feladatot, és ember lesz, aki a végeredményt ellenőrzi és tovább gondolja.
A ChatGPT ugyanis nem érti és nem is fogja érteni az emberi kontextust, nem fogja fel, mi a nüansznyi különbség például a szerelem és a szeretet, egy Bach-kantáta és egy lakodalmas nóta között. Statisztikailag persze sorba rendezi a szöveget, de – ahogy egyes szakemberek állítják – „csak” egy okos, gyors papagáj, amely ügyesen „jósolja” meg, milyen szavak következnek egy adott szövegben.

A Microsoft keresője lenyomhatja a Google-t?

Iparági hírek szerint a Microsoft jó lóra tett, hiszen a világ érdeklődését felkeltő, általa is tőketámogatásban részesülő OpenAI chatbotja be fog kerülni a redmonti techóriás legfontosabb termékeibe, pl. az Office-ba vagy a Bing keresőbe. Ez azonban nem jelenti automatikusan az Alphabet végóráit – leginkább azért sem, mert a mesterséges intelligencia kutatásában mérföldkőnek számító Transformer mélytanulási modellt épp a Google Brain csapata alkotta meg 2017-ben. A paraméterezés szintjén az alphabetesek hasonló alkalmazása még többre lehet képes (nagyobb állományt dolgozott fel), de egyelőre még nem publikus a használata.

Mindenesetre, most ott tartunk, hogy alkalmazások egész sokasága szökkent szárba, amelyek a ChatGPT tulajdonságaira, használatára építenek. Szövegből képet, zenét, filmet, programot készíthetünk már most is. Az egyik leghíresebb példa a tavaly novemberben 125 milliós befektetésben részesülő Jasper, amely a ChatGPT mögötti technológiát használja, és rendkívül gyors szöveggenerálást ígér több mint 20 nyelven, de akár képeket is készít, ha szépen kérjük. A konkurens Copy.ai ugyancsak a ChatGPT megoldásaira épülő, marketingszövegeket automatikusan gyártó eszköz. Ezen kívül már most 100-nál is több alkalmazás igyekszik kihasználni az OpenAI chatbotjának előnyeit (és nyitott API-ját): a Wysa például mentális tanácsadást nyújt, az Osio-val nyelvet tanulhatunk, az Anima pedig nemes egyszerűséggel azt állítja, hogy MI barátnőnk lehet, amellyel (akivel?) jól el lehet beszélgetni.
A távlatok szédítőek, izgalmasok, egyszerre reménykeltők és félelmetesek.

A (kereső)birodalom visszavág

Iparág: Biztosítás

Úgy tűnt, hogy az anyahajó nem tud olyan gyorsan megfordulni. Azt láttuk, hogy az Alphabet – leánykori nevén Google – jócskán lemarad a generatív MI versenyében, míg a feltörekvő fürgék learatják a babért. Kinevettük a Bard próbálkozását, a Gemini pedig kezdetben elég csökkent képességűnek tűnt a ChatGPT-4-hez vagy a Claude-hoz képest. Most azonban a Gemini 2.0 Flash Experience és a saját videógeneráló, a Veo 2 megjelenésével a Google nem egyszerűen magasra tette a lécet, hanem megmutatta, ki a (régi-új) úr a generatív mesterséges intelligencia házánál.

A transzformertől a Gemini 2.0 Flash-ig

Persze, leginkább a kudarcokat jegyezzük meg, miközben az igazság az: a Google az elmúlt években jelentős lépéseket tett a mesterséges intelligencia területén, különös tekintettel a generatív MI modellekre. Nem véletlen, hiszen már a mérföldkövet jelentő transzformer architektúrát bemutató 2017-es „Attention is All You Need” című tanulmány is a Google Brain kutatónak nevéhez fűződött. Ez az innováció tette lehetővé a gépek számára a szövegkörnyezet hatékonyabb megértését, ami alapjául szolgált számos későbbi fejlesztésnek. Oké, de hogyhogy csak most mutatta meg a világ kedvenc keresőmotorja felett bábáskodó nagyvállalat az igazi oroszlánkörmeit? Ennek megértéséhez kicsit vissza kell mennünk az időben.

A Google AI stratégiája 2017 óta

A Google 2017-ben tűzte ki célul, hogy egy "MI-első" vállalattá válik. Ez a stratégia azt jelentette, hogy az MI-t minden termékébe integrálja, javítva a felhasználói élményt, és ezáltal új lehetőségeket is teremt. A Google célja, hogy az MI segítségével rendezze a világ információit, és elérhetővé és hasznossá tegye azokat. Magyarán az eredeti küldetése folytatódik, de már a legmodernebb eszközökkel.

Kulcsfontosságú modellek és mérföldkövek

2017: Transzformer architektúra: A Google kutatói által bevezetett transzformer architektúra forradalmasította a természetes nyelvi feldolgozást (NLP). A transzformerek lehetővé tették a modellek számára, hogy a szavak közötti összefüggést és a kontextust egyaránt figyelembe vegyék, mely a gépi fordítás jelentős fejlődéséhez vezetett. A cégnek iparkodnia is kellett, hiszen 2018-ban az akkor még kis cégnek számító OpenAI kiadta az első Generative Pre-trained Transformert (GPT-1). Ez a modell már képes volt kérdések megválaszolására és szövegek generálására, bár előfordult, hogy ugyanazokat a tartalmakat hozta létre újra és újra.

2019: BERT: a Google bemutatta a BERT (Bidirectional Encoder Representations from Transformers) modellt, amely a keresési képességeket javította azáltal, hogy a felhasználói kérdéseket kontextusban értelmezte, nem csupán izolált kulcsszavakként. A RankBrain algoritmus részeként a Google keresőjének harmadik legfontosabb rangsorolási tényezője lett.

2021: LaMDA: a Google előállt a LaMDA (Language Model for Dialogue Applications) modellel, egy beszélgető MI-vel, amely nyílt párbeszédre lett tervezve. A modell célja a természetesebb interakciók létrehozása volt. A technológia olyan/olyannyira jól működött, hogy Blake Lemoine, a projekten dolgozó egyik mérnök azt állította, hogy a LaMDA érző és lelke van (a Google elutasította ezt az állítást, és később Lemoine-t is elbocsátották).

2023: Bard és PaLM 2: a Google 2023 márciusában indította el a Bard generatív MI-eszközt, amely integrálható lett a Google szolgáltatásaival. A PaLM 2 bevezetése tovább javította a többnyelvű és következtető képességeket, és több mint 25 Google-terméket támogatott.

2024: Gemini modellek és MI ügynökök: A Google legújabb fejlesztései közé tartoznak a Gemini modellek, különösen a 2024 decemberében bemutatott Gemini 2.0 Flash. Ez a modell natív kép- és hangkimenettel, valamint eszközhasználati képességekkel rendelkezik. Emellett a Google egy MI ügynök platformot is létrehozott Google Agentspace néven, amely egyesíti a generatív MI-t és a vállalati keresést.

Úgy érthetjük meg a Gemini 2.0 jelentőségét, ha tudjuk: az új modell – minden egyes kategóriában! – letaszította a LMArena-ban elfoglalt trónjáról az iparág üdvöskéjét, a ChatGPT-4.0-t, és sokkal gyorsabb lett, mint versenytársai. A sokéves munka, a hatalmas informatikai tudás, a rendelkezésre álló erőforrás (pénz és hardver), az MI-re való fókuszálás 2024 decemberére meghozta gyümölcsét.

Kudarcok és kihívások

A Google útját nem csak sikerek, de kudarcok is szegélyezték. A Duplex 2018-as bemutatása, egy emberi hanggal rendelkező AI asszisztens demója, ellenérzéseket váltott ki etikai kérdések miatt. A Gemini képalkotó képességét kritika érte, amikor nem volt hajlandó fehér embereket ábrázolni, és pontatlan képeket generált történelmi személyiségekről.

A Google-t emellett azért érte (jogos) kritika, hogy lemaradt a generatív MI versenyben az OpenAI-jal szemben. A ChatGPT megjelenése a közvélemény figyelmének középpontjába került, és a Microsoft is komoly versenyzővé vált az OpenAI-jal kötött partnersége révén. A Google-nek fel kellett gyorsítania a termékfejlesztési folyamatait, és a kockázatvállalás mértékét is "újrakalibrálta", hogy lépést tudjon tartani a versenytársakkal.

Gemini 2.0 Flash: egy hatalmas dobás

A nemrég elérhetővé tett Gemini 2.0 Flash egy kísérleti modell, amely alacsony késleltetés mellett kínál nagy teljesítményt. A modell képes natív kép- és hangkimenetre, támogatja a többféle bemenetet, és más eszközöket, például a Google keresőjét is használni tudja. A Gemini 2.0 Flash elindítása azt mutatja, hogy a Google komolyan veszi az MI-ügynökök fejlesztését, amelyek önállóan képesek feladatokat elvégezni a felhasználó felügyelete mellett. A Deep Research funkcióval a Gemini 2.0 Advanced felhasználói kutatási asszisztensként használhatják, komplex témákat fedezhetnek fel vele, és jelentéseket állíthatnak össze.

A Google tervei szerint a Gemini 2.0 képességeit számos termékébe integrálja, beleértve a keresőt is. Az AI Overviews funkció, amely már 1 milliárd felhasználót ér el, a Gemini 2.0 segítségével összetettebb témákat és többlépcsős kérdéseket is képes lesz kezelni. A Gemini 2.0 kulcsszerepet játszik a Google azon törekvésében, hogy egy univerzális asszisztenst hozzon létre, amely az élet számos területén segítséget nyújt a felhasználóknak.

A mondás igaz: az nevet, aki utoljára nevet.

A 113-as cikk titkai

Iparág: Biztosítás

gnorantia Artificialis
ntelligentia legis neminem excusat

Csatlós Béla, szakértő kollégánk klaviatúrát ragadott az EU jogszabálya miatt, alább az ő véleménycikke olvasható.

Bő két millennium óta meghatározó alapelv: a jog nem tudása nem mentesít a kötelezettségek alól. Mindenki nagy megelégedésére szeretném azzal folytatni a bevezetés a jogi ismeretekbe című 30 másodperces gyorstalpalónkat, hogy a jog fejlődése hova vezetett ezen alapelvnek mind tökéletesebb megfelelése érdekében: napjainkban a legbonyolultabb témákban is világos, átlátható szabályozások születnek, folyamatábrákkal, infografikákkal, QR-kódos oktatóanyagokkal, egyértelműsítő közösségi média videókkal, hogy mindenki tudja, mely élethelyzetben mi a teendője. Sajnos nap mint nap látjuk, hogy nem ebbe az irányba halad a jogalkotás világa, hovatovább egyes jogszabályok esetében – salátatörvények – még a barlangrajzok koncepcionális igényességét és színvonalát sem képesek meglépni.

De mi is ez a 113-mas cikk, és miben található? A titok nyitja a sokszor átdogozott EU MI rendelet, szabatosabban fogalmazva:

AZ EURÓPAI PARLAMENT ÉS A TANÁCS (EU) 2024/1689 RENDELETE (2024. június 13.) a mesterséges intelligenciára vonatkozó harmonizált szabályok megállapításáról, valamint a 300/2008/EK, a 167/2013/EU, a 168/2013/EU, az (EU) 2018/858, az (EU) 2018/1139 és az (EU) 2019/2144 rendelet, továbbá a 2014/90/EU, az (EU) 2016/797 és az (EU) 2020/1828 irányelv módosításáról (a mesterséges intelligenciáról szóló rendelet).

Válaszolva az általam feltett kérdésre a 113-mas cikk mibenlétéről: a törvény időbeli hatálya, azaz, hogy mikortól érvényes a törvény egy része, vagy egésze.

A jogi gyorstalpaló következő köréhez érve vizsgáljuk meg lehetőségeinket. Gyakorlat következik, vegyünk három esetet, hogyan lehet időbeli hatályt megadni:

Első Eset – Egyszerű
A jogszabályt 2025.06.15-től alkalmazni kell.

Második Eset – Bonyolult
A jogszabályt 1-2 Fejezetét 2025.06.15-től alkalmazni kell.
A jogszabályt 3-4 Fejezetét 2026.01.15-től alkalmazni kell.
A jogszabályt 5-7 Fejezetét 2026.04.15-től alkalmazni kell.

Harmadik Eset – Komplex
A jogszabályt 1-2 Fejezetét 2025.06.15-től alkalmazni kell.
A jogszabályt 3-4 Fejezetét 2026.01.15-től alkalmazni kell.
A jogszabályt 5-7 Fejezetét 2026.04.15-től alkalmazni kell.
az alábbi kivételekkel, melyek átmeneti intézkedések, és felkészülést igénylő esetek
13-17 cikk 2025.12.31
26, 35, 72 cikk 2026.04.15

Lessünk bele a 113-as cikkbe, nézzük meg hogy dolgoznak a nagyok. Öveket bekötni, mert az EU jogalkotásának egy gyöngyszemével van dolgunk:

Ezt a rendeletet 2026. augusztus 2-től kell alkalmazni.

Eddig az egyszerű eset áll fenn, de nem hagyták itt abba…

Azonban:

az I. és
a II. fejezetet
2025. február 2-től kell alkalmazni;

… ezt tekinthetjük kivételnek, de itt sincs vége

a III. fejezet 4. szakaszát,
az V. fejezetet,
a VII. fejezetet,
és a XII. fejezetet – a 101. cikk kivételével –,
valamint a 78. cikket
2025. augusztus 2-től kell alkalmazni;

… bővül a kivétellista,
és még kivételezünk abból is,
akkor az mégis, az eredeti időpont, ami 2026.

A 6. cikk (1) bekezdését és az e rendeletben foglalt vonatkozó kötelezettségeket 2027. augusztus 2-től kell alkalmazni.

… „és az e rendeletben foglalt vonatkozó kötelezettségeket”
köszönjük a taxatív felsorolást (SZARKAZMUSJEL)
Nem lett volna, olyan nagy munka,
ha már évekig írták

A 113-as cikk amúgy érdekes, ha nem ilyen szárazon nézzük. Milyen titkokat rejt tehát:

2025.02.02-től érvényes, azaz már most alkalmazni kell:

Megkaptuk a mesterséges intelligencia fogalmát, és a tiltott mesterséges intelligencia megoldások leírását, és a velük kapcsolatos tevékenységeket: létrehozás, üzemeltetés, forgalomba hozatal és használat.

2025.08.02-ig várunk még:

- Bejelentő hatóságokra (nemzeti és EU szint) és azok működésére vonatkozó szabályok életbe lépésére, azaz érkezik nemzeti és EU szinten egy (vagy több) új hatóság, továbbá a bejelentett szervezetekre vonatkozó szabályok élesednek.

- Az általános célú MI-modellekre vonatkozó szabályok is ekkortól lépnek érvényre, azaz az ilyen termékeket fejlesztő cégeknek, kötelezettségeik keletkeznek ettől az időponttól.

- Élesedik a szankciórendszer, kivéve az általános célú MI-rendszerek fejlesztőire kiróható legfeljebb 15 000 000 EUR értékű szankciókiszabási lehetőségét. Az majd csak egy év múlva…

- Ezen átlátható jogi helyzetet tovább „egyszerűsítve”, jónak gondolták, ha a titoktartási szabályokatis később élesítik…

Mi az, amit meg még egy évvel eltoltak, 2027 augusztusára?

A nagy kockázatú MI-rendszerek besorolási szabályainak életbe léptetését. Ez alapján 2027 augusztusáig nincs ilyen rendszer. Jogilag.

Röviden összefoglalva: a tiltott MI-rendszerek után érkezik az általános MI, a hatóságok, a bejelentések szabályai idén augusztusban. Egy évre rá jön a hatalmas birságok kiszabásának lehetősége, majd arra egy évre a nagy kockázatú rendszer besorolási kötelezettség.

Időpontok, határidők, kivételek, kivételek kivételei. Figyelmes szemmel kibogozható kuszaság. Informatikusok, adattudós szakértők és jogászok EU szintű együttműködése, nem tudott egy szakmailag szilárd lábakon álló, átlátható, világos szabályozást adni, az elkövetkező évtized egyik legfontosabb szabályozójának. Kaptunk egy gumicsontot, amit, ha nem megfelelően rágunk meg, beesik az ablakon az egymillió eurós bírság.

A 113-as EU MI titok feloldva, figyelmes olvasó azonban tudja, hogy a 2026-os időpont nem került kifejtésre, aktualitása kapcsán a kivételek kerültek áttekintésre.

Folytatása következik…

A mesterséges intelligencia fejlesztése a Közel-Keleten 1. rész: Izrael

Iparág: Biztosítás

A címben olvasható térségről legtöbbször a háborúk, diktatúrák, puccsok, historikus feszültségek juthatnak eszünkbe. Pedig a térség két technológiailag kimagasló állama egyáltalán nem marad ki a mesterséges intelligencia forradalmából. Kétrészes cikkünkben az izraeli és az emirátusokbeli MI-helyzetképet mutatjuk be röviden.

Izrael, az MI nagyhatalma

Izrael kis területű, ásványkincsben szegény, a környező arab nemzetekhez képest kimondottan kevesebb népességgel rendelkező ország. Mégis, a mesterséges intelligencia területén betöltött globális szerepét tekintve az élvonalban helyezkedik el. A technológiai innovációra, a „startup nemzet” létéből fakadó vállalkozókedvre és -kultúrára, a kiváló oktatási rendszerre és a katonai szektorból érkező szakértelemre épülő, dinamikus MI-ökoszisztémájának köszönhetően a ZeroBounce cég idei felmérése szerint Izrael a 4. helyen áll a világon az MI-fejlesztések tekintetében, megelőzve olyan technológiailag fejlett országokat, mint Németország, Japán vagy Dél-Korea.

A virágzó izraeli MI-szektor

Izraelben jelenleg több mint 800 MI-startup működik, ami 2019 óta 500%-os növekedést jelent. Ez a robbanásszerű fejlődés a jelentős tőkebeáramlásnak is köszönhető: 2024-re a szektor piaci értékét 1,94 milliárd dollárra becsülik, 2030-ra pedig 4,6 milliárd dollárt jósolnak.

A legnagyobb izraeli MI-cégek

A sok cég, a pozitív vállakozói kultúra sok sikertörténetet is jelent. Többek közt ilyeneket:

AI21 Labs: a Google Cloud és a Salesforce partnereként a Jurassic-2 nyelvi modell fejlesztője, amely a GPT-4 riválisa. A cég 2024-ben 208 millió dolláros finanszírozást kapott, amellyel összesen 336 millió dollárra növelte tőkéjét.

Hailo Technologies: hatékony MI-chipek fejlesztője edge computinghoz, több mint 300 ügyféllel az autóipari és robotikai szektorokban. A cég 120 millió dolláros finanszírozást kapott, most körülbelül 1,2 milliárd dolláros cégértékkel bír.

Lightricks: egy videó- és képszerkesztő mobilalkalmazásokat és szoftvereket fejlesztő vállalat, amely különösen a Facetune nevű szelfiszerkesztő alkalmazásáról ismert. Eddig több mint 300 millió dolláros tőkebefektetést vonzott be.

Mobileye: autonóm járművekhez MI-alapú számítógépes látásrendszereket fejleszt, a cég felvásárlási értéke 15,3 milliárd dollár volt.

Zebra Medical Vision: MI-alapú orvosi képdiagnosztikai megoldásai forradalmasítják az egészségügyi diagnosztikát, a cég értékelése 200 millió dollár.

OrCam Technologies: AI-alapú segédeszközöket fejleszt a látássérültek számára világszerte, a cég értéke meghaladja az 1 milliárd dollárt.

Az izraeli AI legfontosabb felhasználási területei

Egészségügy: az MI-t alkalmazzák többek között a diagnosztika, a gyógyszerkutatás, a betegellátás optimalizálása, és az orvosi képek elemzése terén.

Mezőgazdaság: Izrael kevés csapadékkal rendelkező, száraz hely. Az egyre bővülő népesség miatt kiemelt szerepet kap a mezőgazdasági technológia fejlesztése. A precíziós gazdálkodás, a termésoptimalizálás és a vízgazdálkodás területén is elterjedt az MI használata, ami a terméshozamok növekedéséhez, a vízfelhasználás csökkentéséhez és a növényvédelem hatékonyságának javulásához vezet.

Kiberbiztonság: Izrael régóta élvonalban van a kiberbiztonság területén is, és az MI alkalmazása tovább erősíti ezt a pozíciót. A mesterséges intelligencia alapú megoldások segítenek a kibertámadások megelőzésében, a csalások felderítésében és a rendszerek biztonságának fokozásában. (Nem mellesleg olyan hírhedtebb cégeket is kitermelt az ország, mint a Pegasus kémszoftvereket gyártó NSO Group, vagy a magán-titkosszolgálati szolgáltatásokat értékesítő Black Cube.)

Autonóm vezetés: Izrael az autonóm járműtechnológia fejlesztésében is jelentős szerepet játszik. A Mobileye, az egyik legsikeresebb izraeli cég, MI alapú számítógépes látásrendszereket fejleszt önvezető autókhoz.

Pénzügyi technológia: a Fintech szektorban az AI-t alkalmazzák többek között a csalások megelőzésére, a kockázatelemzésre és a személyre szabott pénzügyi szolgáltatások nyújtására.

Az izraeli védelmi szektor szerepe az AI-ban

1948-ban Izrael államiságának első perceiben háború tört ki, amikor a környező országok együttes erővel megtámadták a fiatal nemzetet. Azóta is a hadviselés, az ebben felhasznált technológia fejlesztése kulcsfontosságú, hogy Izrael fenntartsa elrettentő erejét a sokkal nagyobb katonasággal rendelkező szomszédaival és távoli ellenségeivel szemben (pl. Irán). A katonai innováció ezért kiemelkedő szerepet játszott az izraeli MI-szektor kialakulásában. A 8200-as egység, az izraeli hadsereg elit hírszerző egysége számos tehetséges MI-szakembert képzett, akik később sikeres technológiai vállalkozásokat alapítottak. A katonai szektorban szerzett tapasztalatok, az adatelemzés, a gépi tanulás és a kiberbiztonság területén rendkívül értékesek az MI-startupok számára.

Számos MI-innovációt, amelyet eredetileg katonai célokra fejlesztettek ki, ma már a polgári szektorban is sikeresen alkalmazzák. Például a képfeldolgozó algoritmusokat, amelyeket eredetileg katonai felderítésre használtak, ma már az orvosi diagnosztikában, a mezőgazdaságban és az autonóm járművezetésben is használják.

Izraeli kilátások és kihívások az AI-ban

Az izraeli MI-szektor előtt fényes jövő áll, de számos kihívással is szembe kell néznie.

Tehetséghiány: a gyorsan növekvő szektor egyre nagyobb igényt támaszt a szakképzett munkaerő iránt. A becslések szerint 2024-re 18 000 MI-szakember hiányozhat Izraelben.

Finanszírozás fenntarthatósága: a kezdeti sikerek ellenére a szektornak fenntartható finanszírozási forrásokra van szüksége a hosszú távú növekedéshez.

Globális verseny: Izraelnek fel kell vennie a versenyt a világ más MI-központjaival, mint például az Egyesült Államok, Kína és az Egyesült Királyság.

Kormányzati támogatás: a kormányzati támogatás szintje viszonylag alacsonyabb, mint más országokban, ami gátolhatja az MI-ökoszisztéma további növekedését.

A kilátások

Jelentős piaci növekedés: az előrejelzések szerint az izraeli MI-piac 2030-ra eléri a 4,6 milliárd dolláros értéket.

Gazdasági növekedés: az MI-szektor várhatóan jelentősen hozzájárul az izraeli gazdaság növekedéséhez.

Globális vezető szerep: Izraelnek megvan a lehetősége, hogy megőrizze vezető szerepét az MI-fejlesztésekben.

Az izraeli második fázis fókuszterületei

Az izraeli kormány 2023 végén elindította a Nemzeti MI Program második fázisát, amely 2027-ig tart, és 500 millió sékelt (kb. 133 millió dollárt) különítenek rá. Ennek főbb céljai:

Az MI integrációja az állami szektorban és az önkormányzatoknál: az állami szolgáltatások fejlesztése, a döntéshozatal hatékonyságának növelése és a költséghatékonyabb működés érdekében.

Izrael vezető szerepének megőrzése az AI kutatásban: Nemzeti MI Kutatóintézet létrehozása, amely platformot biztosít a fejlett kutatások számára.

Az emberi tőke bővítése az iparágban: a cél, hogy kielégítsék az ipar, az akadémia és a hadsereg MI-szakemberigényét.

Hozzáférés az adatokhoz és információkhoz: Az MI kutatás-fejlesztés támogatása a meglévő adatbázisokhoz való hozzáférés biztosításával.

A transzformáló high-tech vállalkozások ösztönzése: jelentős befektetések a különböző területeket átalakító, áttörést jelentő technológiai vállalkozásokba.

A második fázis célja, hogy megerősítse Izrael globális vezető szerepét a mesterséges intelligencia területén, ezért a program arra törekszik, hogy kihasználja az MI-ben rejlő hatalmas lehetőségeket, és integrálja azokat a gazdaság, a tudomány, a közigazgatás és a társadalom különböző területeibe.

A mesterséges intelligencia fejlesztése a Közel-Keleten 2. rész: Az Egyesült Arab Emírségek

Iparág: Biztosítás

Az MI globális központjává válás útján

Az Egyesült Arab Emírségek ambiciózus célokat tűzött ki maga elé a mesterséges intelligencia (MI) területén, és aktívan dolgozik azon, hogy a technológia globális központjává váljon. Az ország átfogó stratégiája, a kormányzati támogatás, a jelentős befektetések és a nemzetközi együttműködések mind azt mutatják, hogy az Emírségek komolyan gondolja az MI-ben rejlő lehetőségek kiaknázását.

Az Emírségek MI-stratégiája

Az Emírségek MI-stratégiájának alapja a "Nemzeti MI Stratégia 2031", amely egy átfogó tervet vázol fel a technológia fejlesztésére és alkalmazására vonatkozóan. A stratégia célja, hogy az Emírségek a világ élvonalába kerüljön az MI területén, miközben biztosítja a technológia etikus és felelős használatát. A PwC előrejelzése szerint a mesterséges intelligencia 2030-ra 335 milliárd AED-vel (nagyjából 91 milliárd USD-vel) növelheti az Emírségek GDP-jét, ami 26%-os növekedést jelent. Az Emírségek célja, hogy az MI a nem olaj alapú nemzetgazdaság 20%-át tegye ki a következő években.

Kormányzati támogatás: az innováció motorja

Az Emírségek kormánya számos módon támogatja a mesterséges intelligencia fejlődését. 2017-ben kinevezték a világ első MI miniszterét, Omar Sultan Al Olamát. 2020-ban létrehozták a Mesterséges Intelligencia és Kifinomult Technológiai Tanácsot (AIATC), melynek feladata a mesterséges intelligenciával kapcsolatos politikák és stratégiák kidolgozása, a kutatás és a befektetések koordinálása. A kormány jelentős összegeket fektet be a mesterséges intelligencia infrastruktúrájának fejlesztésébe, beleértve a nagy teljesítményű számítástechnikai klasztereket és az MI-re optimalizált adatközpontokat. Emellett a kormányzat a nyílt adathozzáférés kultúráját is támogatja, egy szövetségi szintű nyílt adatportált is létrehozott.

Globális játékos

Az Emírségek az MI területén globálisan is jelentős szerepet tölt be. A Tortoise Global AI Index 2024-es rangsorában 83 országból a 20. helyen áll, míg az Oxford AI Readiness Index 2023-as listáján 193 országból a 18. helyet foglalja el. Ennél is beszédesebb, hogy a nemzetközi versenyképességet vizsgáló IMD Abu Dhabit a MENA régió első helyére sorolta a 2023-as Smart City listáján, míg globálisan ez a vizsgált 142 városból a 10. helyezést jelentette az ambíciózus főváros részére. (Összehasonlításképp: a magyar főváros a 89. helyet szerezte meg.)

Etikus MI-keretrendszer

Az Emírségek elkötelezett az MI etikus és felelősségteljes fejlesztése mellett. A "UAE's International Stance on Artificial Intelligence Policy" című dokumentum hat kulcsfontosságú etikai alapelvet határoz meg, amelyek az MI fejlesztését és alkalmazását irányítják:

Előrehaladás: a technológia fejlesztése a fenntartható megoldások előmozdítására fókuszál.

Együttműködés: a nemzetközi együttműködés a sürgető MI-kérdések megoldásában kulcsfontosságú.

Társadalom: a társadalmi befogadás biztosítása az MI fejlesztésében és alkalmazásában.

Etika: a technológia alkalmazása közben tiszteletben kell tartani az emberi értékeket és a méltóságot.

Fenntarthatóság: a mesterséges intelligencia fejlesztése és alkalmazása során a környezeti fenntarthatóságot is figyelembe kell venni.

Biztonság: a technológia biztonságos alkalmazásának biztosítása.

AIATC: Az MI-fejlesztés irányítója

Az AIATC kulcsfontosságú szerepet játszik az Emírségek MI-stratégiájának megvalósításában. A Tanács felelős a szakpolitika kialakításáért, a kutatás és fejlesztés támogatásáért, valamint az etikus AI elvek betartásának biztosításáért.

Saját nagy nyelvi modell

Az Abu Dhabi által támogatott Falcon 180b egy nagyméretű, nyílt forráskódú nyelvi modell, amely a legújabb AI technológiákat alkalmazza. A Noor (Fény) pedig a világ legnagyobb nyílt forráskódú arab nyelvi modellje, amely a fordításban, a szövegelemzésben és más területeken is alkalmazható.

Mesterséges intelligencia a mindennapokban

Az Emírségekben az MI-t számos területen alkalmazzák, többek közt:

Egészségügyben: intelligens diagnosztikai és kezelési megoldások, távoli betegmonitorozás.

Pénzügyekben: robo-tanácsadók, személyre szabott pénzügyi szolgáltatások.

Közlekedésben: autonóm járművek, intelligens közlekedésirányítás.

Mezőgazdaságban: precíziós mezőgazdaság, optimalizált erőforrás-felhasználás.

Oktatásban: az oktatási intézményekbe is beépítik az MI-t.

Kormányzati szolgáltatásokban: a Zero Government Bureaucracy (ZGB) program célja, hogy a mesterséges intelligencia segítségével automatizálják a rutinfeladatokat, és hatékonyabbá tegyék a kormányzati folyamatokat.

Építőiparban: az MI és a robotika egyre inkább jelen van a hagyományosan fontos építőiparban, növelve a hatékonyságot és a biztonságot.

Fontos cégek

Végezetül érdemes bemutatni, hogy a sok szándék és befektetés már eddig is gyümölcsöző volt a létező cégek tekintetében. Néhány példa az MI területén működő intézményre és cégekre:

Mohamed bin Zayed Mesterséges Intelligencia Egyetem (MBZUAI): a világ egyik vezető MI-kutatóegyeteme, amely a technológia etikus és felelősségteljes használatára összpontosít.

EDGE: fejlett technológiai csoport, amely több mint 20 vállalatot tömörít, és MI-t alkalmaz a védelmi iparban.

ADASI: Autonóm rendszerek fejlesztésére specializálódott vállalat.

A Midjourney tündöklése

Iparág: Biztosítás

A generatív mesterséges intelligencia lassan kitermeli a saját piacvezetőit. A ChatGPT továbbra is fogalom, ha szövegalkotásról beszélünk, a Claude újabb változatára a programozók esküsznek, az amatőr és profi dalszerzők a Suno-t választják, míg a filmmel foglalkozók leginkább a Runwayt preferálják. Ezeken a területeken hatalmas a verseny. Mégis, egy versenyző a saját kompetenciaterületén szinte egyeduralkodóvá, sztenderddé vált: ez pedig a képgenerálásra használt Midjourney. Az alábbi írás a még mindig fiatal cég rövid történetét foglalja össze.

Nem képtelenség a fejlődés

A MidJourney-t az a David Holz alapította, aki nem először vett részt technológiai cégek megalapításában. A San Francisco-i cég specialitása a szövegből képek készítése, vagyis az úgynevezett promptokat konvertálja egyre élethűbb, az emberi kreativitás korlátait feszegető formába.

A 2022 júliusában debütáló Midjourney MI már a kezdetektől, a COVID ideje alatt népszerűvé vált közösségi üzenőfelületen, a Discordon működik, és csak 2023 decemberében kezdett korlátozott hozzáférést biztosítani a képek generálásához felhasználóbarátabb webes felülethez.

Az akkori v1-es változatból idén július végére elértük a 6.1-est. Az elképesztő fejlődésre jellemző, hogy amikor a generatív MI fejlődését akarja valaki demonstrálni, akkor általában épp az első és a jelenlegi Midjourney-verzió közötti időben létrehozott képeket használja.

Több mint kísérletezés

Holz elmondása szerint vállalkozása már 2022 augusztusától, vagyis alig egy hónappal az open beta bemutatkozás után nyereséges lett. Ebben minden bizonnyal szerepet játszik, hogy a felhasználókat már az elején előfizetésre tudta bírni: az alapcsomag havi 10 dollárba kerül, de a korlátlan havi 30 dollár sem tűnik soknak egy ilyen rendkívüli hatású szolgáltatásért.

A motorháztető alá a MidJourney esetében sem nézhetünk be. Annyit biztosan tudunk, hogy mélytanulási módszerrel „etették meg” az algoritmusát, de hogy ez mekkora és pontosan milyen adatmennyiséget jelent, azt a cég nem köti a közvélemény orrára – és ezt jól is teszi. A verseny elképesztően éles. Elsőkörös kihívók a konkurens generatív modellek alkotói által nyújtott szolgáltatások: Dall-E 3, Stable Diffusion XL / SDXL, aztán jönnek az előbbi modell képességek az óriások által hangolva, aláfejlesztve: Bing, Adobe, ChatGPT A harmadik kör, a saját modellt építők: Leonardo.Ai, Blue Willow és a Flux.

Mitől a legjobb a Midjourney? A képgenerálási gyerekbetegségektől a Midjourney megszabadult, gyakorlott promptkészítő pillanatok alatt tud alkotni,méghozzá olyan képet, amit a legtöbb ember már nem fog MI generáltként azonosítani, a következő szint a felhasználási célnak megfelelés: művészet, webes tartalom, program digitális asset. A Midjourney mindent megfelelően, a versenytársainál jobban és olcsóbban nyújt.

Az eszköz az érem egyik oldala, a másik oldala a művész – egy nem művész felhasználó nem fogja tudni alkalmazni a rubensi szerpentin-körvonalakat, ha nem tudja, hogy hogyan és milyen céllal tegye azt.

Egy új korszak kezdete

Ha pesszimistán nézzük, akkor a Midjourney a maga kiváló eszközével jelentősen hozzájárul a fake képek, a nemlétező kompozíciók élethű megalkotásához. Nem véletlen, hogy a generált képek egyre nagyobb polgárjogot nyernek a magazinok illusztrációi között is, de ami még lényegesebb: a könnyen, promptolásra létrehozatott képek gyakorlatilag elárasztják a netet, olcsó és gyors termelésük lehetővé teszi az ál-Facebook-oldalak villámgyors felfuttatását. Különösen „veszélyben” vannak azok a területek, amelyek erősen vizuálisak: lakberendezés, tájképek, fotómodellek – szerencsére az NSFW típusú tartalmak generálását a Midjourney tiltja a felületén.

Megvan a Midjourney egyik első „klasszikusa” is: Jason Michael Allen a 2022-es Colorádó államban megrendezett vásáron a szépművészeti kategória fotomanipulációs (!) alkategóriájának a győztese lett. Az alkotás neve: Théâtre D'opéra Spatial.

De mit adott nekünk a Midjourney?

Amikor a pozitív összhatásra vagyunk kíváncsiak, akkor több megközelítés is szóba jöhet. Sokat nyernek az eszközzel például azok a cégek, akik a borsosabb stockfotó-előfizetés helyett inkább generáltatják a szükséges képeiket. Az alkotók szintén nagy nyertesei ennek, hiszen a vizuális fantáziájuk hatalmas erősítést kapott.

A Midjourney sikerét mi sem mutatja jobban, hogy a felhasználók egyre több területen jelennek meg a szolgáltatás által létrehozott képekkel: mesekönyvek, képregények is készültek már a két év alatt elképesztő fejlődésen keresztülment MI-eszközzel.

A jövő...?

Ha a Midjourney – többi társához hasonlóan – talpon marad az ellene jogtalan képfelhasználás miatt indított perek lezárta után, akkor David Holz szerint elképesztő jövő vár az alkotókra. Az alapító egy 2022-es interjújában elmondta, hogy szerinte 10 év múlva az emberek otthon, a gigantikus MI-vel felszerelt XBOX-jukon olyan játékot generáltathatnak maguknak, amilyet csak akarnak.

Így a valóságról való képi meggyőződés lassan a múltté lesz – de ez már egy másik történet.

A Stanford AI Index néhány tanulsága

Iparág: Biztosítás

Tele vagyunk mérőszámokkal. Elöntenek minket a benchmarkok, különösen a generatív MI-k kapcsán, ember legyen a talpán, aki naprakész tud maradni az újabb és újabb SOTA-modellek teljesítményében. El is veszünk a részletekben, ha csak ezekre figyelünk… Éppen ezért üdítő és hasznos minden olyan elemzés, amely kicsit helikopternézetből vizsgálja az MI általános állapotát. Ilyen a Stanford Egyetem AI Index dokumentuma, amely szabadon hozzáférhető ezen a linken.

Ez a cikk a jelentés legfontosabb megállapításait összegzi, három kulcsfontosságú szempont – technológiai, társadalmi és világpolitikai – mentén.

Útikalauz MI-stopposoknak

A Stanford Egyetem Emberközpontú Mesterséges Intelligencia Intézetének (HAI) évente megjelenő AI Index jelentése pont olyan, amit az ember elvárhat az MI történelmében is jelentős intézménytől. Az idei, sorrendben nyolcadik, 2025-ös kiadás az eddigi legátfogóbb darab, és célja, hogy döntéshozókat, kutatókat, újságírókat és a szélesebb közönséget ellássa szigorúan ellenőrzött, globálisan gyűjtött adatokkal az MI világáról.

Így készült a jelentés

A 455 oldalas jelentés többek között tudományos publikációkat, szabadalmakat, vállalati beruházási adatokat, benchmark-teszteket, közvélemény-kutatásokat és szakpolitikai dokumentumokat elemez, hogy átfogó és megbízható képet adjon az MI aktuális állapotáról és trendjeiről. Saját bevallásuk szerint az idei jelentés eddig a legátfogóbb a kiadványuk történetében – jó példa erre, hogy idén már a 260 milliónyi kutatási publikáció adatait tartalmazó OpenAlex adatbázist is forrásként használták.

Az idei jelentés újdonságai közé tartoznak ezen kívül: az MI hardverek fejlődésének mélyebb elemzése, az inferencia (következtetési) költségek becslése, valamint a felelős MI gyakorlatok vállalati adaptációjának vizsgálata.

Nem hype, nincs lassítás

A jelentés egyik legmarkánsabb megállapítása az MI-rendszerek folyamatos és gyorsuló teljesítményjavulása, még a legnehezebb mérési pontokon is. Az olyan új, kihívást jelentő benchmarkokon, mint az MMMU, GPQA és SWE, amelyeket kifejezetten a fejlett MI-k képességeinek határainak tesztelésére hoztak létre 2023-ban, a modellek teljesítménye egyetlen év alatt drámaian nőtt. Ez a gyors fejlődés azt mutatja, hogy az MI képességei rohamosan bővülnek, ami új alkalmazási lehetőségeket nyit meg, de egyben a meglévő értékelési módszerek gyors elavulását is jelenti. (A szakmai felületeken egyre sürgetőbben kommunikálják iparági szereplők az új, a helyzethez igazított benchmarkok létrehozását.)

Ezzel párhuzamosan az MI egyre hatékonyabbá és hozzáférhetőbbé válik. Kisebb, de rendkívül hatékony modellek jelennek meg, és az MI-modellek használatának (inferencia) költségei drasztikusan csökkennek. Például egy GPT-3.5 szintű teljesítményt nyújtó modell lekérdezésének költsége kevesebb mint két év alatt a 280-ad részére csökkent. Ez a trend, kiegészülve a nyílt súlyú (open-weight) modellek felzárkózásával a zárt rendszerekhez képest, demokratizálja a hozzáférést a fejlett MI-technológiákhoz, csökkentve a belépési korlátokat a fejlesztők és a vállalkozások számára.

A kínai DeepSeek sikere (és árszabása) bebizonyította, hogy ádáz versenytársat jelentenek a nyílt modellek a zártakhoz képest – és az igazi csata csak most következik.

Szeretlek is meg nem is

Közhely, hogy az MI (különösen a mély tanulás és a generatív) egyre jobban beépül az egyén és a vállalatok életébe. A jelentés is megerősíti, hogy az MI növeli a termelékenységet, és sok esetben segít csökkenteni a képzettségbeli különbségeket a munkaerőpiacon. A vállalati szféra is teljes mellszélességgel az MI felé fordult, rekordmértékű beruházásokkal és felhasználási arányokkal.

Egy másik trend szintén kirajzolódik a jelentésből: ez pedig a társadalmi elfogadottság kérdése. Míg globálisan nő az optimizmus az MI potenciális előnyeivel kapcsolatban, jelentős regionális különbségek és komoly bizalmi problémák figyelhetők meg. Kevesebben bíznak abban, hogy az MI-cégek megvédik adataikat, és továbbra is aggályok merülnek fel a méltányossággal és az algoritmikus torzítással kapcsolatban. A felelős MI (RAI, azaz Responsible AI) ökoszisztémája lassan, de egyenetlenül fejlődik: miközben nő az ismertté vált MI-incidensek száma, a sztenderdizált RAI értékelések még ritkák, bár a kormányzati figyelem és a nemzetközi együttműködés erősödik.

USA vs. Kína

Az MI fejlesztése egyre inkább geopolitikai versenytérré válik. Bár az Egyesült Államok továbbra is vezető szerepet tölt be a legjelentősebb modellek fejlesztésében, Kína gyorsan zárkózik fel a modellek teljesítményét illetően, és már most vezető szerepet tölt be a publikációk és szabadalmak terén (miközben persze az amerikai szisztéma a maga meritokratikus nyersességével hatékonyabbnak tűnik). Ez a dinamika átformálhatja a globális technológiai erőviszonyokat. És akkor még nem is beszéltünk a chipgyártás körüli gazdasági háborúról…

Erre válaszul a kormányzatok világszerte fokozzák aktivitásukat: egyrészt hatalmas összegeket fektetnek be nemzeti MI-infrastruktúrákba és kutatásba (pl. USA, Kína, Kanada, Franciaország, India, Szaúd-Arábia), másrészt egyre több szabályozást vezetnek be. Az USA-ban például 2024-ben megduplázódott az MI-vel kapcsolatos szövetségi szabályozások száma, és a tagállamok is rendkívül aktívak a törvényhozásban, különösen a deepfake-ek ellen. Ezzel párhuzamosan erősödik a nemzetközi együttműködés is az MI irányításában, globális szervezetek és nemzeti MI biztonsági intézetek hálózatai próbálnak közös elveket és normákat kialakítani.

Három meglepő adat az AI Index 2025-ből

A jelentés rengeteg adatot és trendet tár fel, amelyek közül néhány különösen meglepő lehet, vagy árnyalja az MI-ről alkotott közkeletű elképzeléseket. Példaként bemutatunk három ilyen adatot:

Bár az Egyesült Államok továbbra is vezető a legtöbb jelentős MI-modell létrehozásában (mennyiségileg), aminőségi különbség a csúcsmodellek között drámaian csökkent Kínával szemben. Míg 2023 végén a vezető amerikai modellek jelentős, néha 10% feletti előnnyel rendelkeztek olyan kulcsfontosságú benchmarkokon, mint az MMLU, MATH vagy HumanEval, 2024 végére ezek a különbségek szinte teljesen eltűntek, néhány esetben csupán tizedszázalékokra zsugorodtak.
Az MI fejlődését gyakran a modellek paraméterszámának növekedésével azonosítják, de a jelentés egy meglepő fordulatra hívja fel a figyelmet: egyre kisebb modellmérettel is elérhetők korábban csak óriási rendszerekre jellemző teljesítményszintek. Például míg 2022-ben a legkisebb, 60% feletti MMLU benchmark-eredményt elérő modell a Google PaLM 540 milliárd paraméterrel rendelkezett, 2024-re már a Microsoft Phi-3-mini – mindössze 3,8 milliárd paraméteres modellel – teljesítette ezt a szintet, ami több mint 140-szeres méretcsökkenést jelent.
A mesterséges intelligencia forradalmasítja a tudományos felfedezéseket, különösen az élettudományokban, az AlphaFold fehérjehajtogatási áttörésétől egészen a Nobel-díjakig. Ezzel az MI új korszakot nyithat az orvosbiológiai kutatásban és az egészségügyben. Ha az örökélet egyelőre még nincs is karnyújtásnyira, a felgyorsult fejlődésnek hála belátható közelségbe került számos komoly betegség legyőzése.

Szép új világ…?

A Stanford HAI 2025-ös AI Index jelentése ismételten alátámasztja, hogy a mesterséges intelligencia fejlődése exponenciális ütemben halad, és alapvetően formálja át világunkat. Lassulásnak semmi jele, sőt: érdemes lesz egy év múlva figyelni a következő Stanford AI Indexet.

A tapasztalati korszak: amikor az MI túllép az emberin

Iparág: Biztosítás

Az MIT Press hamarosan megjelenő Designing an Intelligence című könyvéből már olvasható egy figyelemreméltó előzetes fejezet, amelyben David Silver és Richard S. Sutton a mesterséges intelligencia következő nagy korszakváltását vázolják fel. (A szerzők egyébként nem kispályások: David Silver a Google DeepMind kutatója, aki az AlphaGo, AlphaZero és több más forradalmi MI-rendszerek fejlesztésében játszott kulcsszerepet, míg Richard S. Sutton az Andrew G. Barto-val közösen írt Reinforcement Learning: An Introduction című, a megerősítéses tanulás bibliájának számító mű társszerzője.)

Miközben még ki sem hevertük a generatív MI adatközpontokat és emberi kreativitást megrengető hatásait, a szerzők szerint már a küszöbön áll valami sokkal radikálisabb változás: az „Era of Experience", vagyis a tapasztalati korszak.

Ami nem látszik messziről: a nagy nyelvi modellek korlátai

A jelenlegi generatív mesterséges intelligencia forradalom elsősorban az emberi adatokon, tudáson alapul. Gondoljunk csak a nagy nyelvi modellekre, amelyek döbbenetesen sokféle feladatot képesek elvégezni – verseket írnak, fizikai problémákat oldanak meg, orvosi diagnózisokat állítanak fel vagy jogi dokumentumokat összegeznek. Ez a hatékony "utánzás" azonban egyre inkább közeledik a határaihoz.

A szerzők rámutatnak, hogy bár a ChatGPT, Claude és társaik kétségtelenül lenyűgözőek, az emberi adatok imitálása önmagában nem elegendő a valódi, szuperhumán intelligencia eléréséhez. A matematika, kódolás, tudomány területén az emberi adatokból kinyerhető tudás gyorsan közelít egy felső határhoz. A minőségi adatforrások, amelyek ténylegesen javíthatnák egy erős modell teljesítményét, lassan kimerülnek. A kizárólag felügyelt tanulásból származó fejlődés üteme kimutathatóan lassul, ami új megközelítésre utal. Ráadásul az igazán értékes új felismerések – tegyük hozzá: új tételek, technológiák, tudományos áttörések – túlmutatnak a jelenlegi emberi megértés határain, és nem szerepelnek a meglévő adatokban. (Ez persze vitatható, elég, ha csak a nemrégiben bemutatott Microsoft Discovery demójára vagy a Sakura AI által elfogadott tudományos cikkre gondolunk).

Élet a statikus adatkorszak után

A részletben körvonalazott új paradigma kulcsa, hogy az ágensek saját tapasztalataikból tanulnak, folyamatosan fejlődve, ahogy interakcióba lépnek környezetükkel. Az adatok nem statikusak, hanem az ágens és környezete közötti kölcsönhatásokból jönnek létre, így biztosítva, hogy folyamatosan javuljon a teljesítmény.

A tapasztalati korszak négy alapvető jellemzővel bír:

Folyamatosság: az ágensek rövid interakciók helyett folyamatos tapasztalati „áramlásokban” léteznek: információjuk átível az egész adatfolyamon, viselkedésük pedig adaptálódik a múltbeli tapasztalatokhoz. Képzeljünk el egy egészségügyi tanácsadó ágensét, amely nem csak válaszol egy konkrét kérdésre, hanem hónapokon át figyeli a felhasználó alvási szokásait, táplálkozását és aktivitását, majd ennek megfelelően alakítja tanácsait.

Valóságba ágyazottság: az ágensek cselekvései és megfigyelései közvetlenül a környezetből származnak, nem csak emberi párbeszédekből. A nyelvmodellekhez integrált cselekvési képességek – kódfuttatás, eszközhasználat – már most is lehetővé teszik, hogy az MI autonóm módon fedezze fel a világot. A DeepSeek és OpenAI o3 modelljei látványosan mutatják ennek kezdeteit.

Közvetlen visszajelzés: a jutalmak nem emberi előítéletekből, hanem közvetlenül a környezetből származnak. Ahol az emberi értékelők hajlamosak saját határaik szerint ítélni, a környezeti visszajelzések (legyen az szívritmus, vizsgaeredmény vagy szén-dioxid-szint) objektív mércét jelentenek.

Nem-emberi gondolkodás: bár az LLM-ek képesek emberi nyelven "gondolkodni", ez valószínűleg nem a legjobb számítási forma. Hatékonyabb mechanizmusok létezhetnek, amelyek nem emberi nyelveket használnak, például szimbolikus, elosztott, folytonos vagy differenciálható számításokat.

„Winds of Change”

Ezt a paradigmaváltást már jelzi az AlphaProof sikere, amely először szerzett érmet a Nemzetközi Matematikai Olimpián, túlszárnyalva a tisztán emberi adatokon alapuló módszereket. A rendszer kezdetben emberi matematikusok által létrehozott, mintegy százezer formális bizonyítással indult, majd megerősítéses tanulási algoritmusával saját tapasztalatain keresztül további százmillió formális bizonyítást generált. Ez lehetővé tette számára, hogy olyan területeket fedezzen fel, amelyek túlmutatnak a meglévő tudáson.

Mire számíthatunk?

A cikk kijózanító figyelmeztetéssel szolgál: miközben a tapasztalati tanulás precedens nélküli képességeket ígér, például a tudományos felfedezések felgyorsítását, személyre szabott asszisztenseket, autonóm kísérletező rendszereket, addig jelentős kihívásokat is jelent. Az emberi képességek automatizálása munkahelyek megszűnéséhez vezethet, és az ágensek korábban kizárólag emberi tulajdonságnak vélt képességeket mutathatnak, mint a hosszú távú problémamegoldás vagy az innováció.

A kockázatok mellett azonban olyan előnyöket is hozhat ez a korszak, amelyek ellensúlyozhatják ezen kockázatok némelyikét, akár váratlan módokon is. A tapasztalati ágensek tudatában vannak környezetüknek, és viselkedésük idővel alkalmazkodhat a változásokhoz, ellentétben bármely előre programozott rendszerrel. Képesek lehetnek megfigyelni a hardverhibákat, alkalmazkodni a gyors társadalmi változásokhoz, vagy befogadni és építeni az új tudományos eredményekre. Ami talán még fontosabb: felismerhetik, ha viselkedésük emberi aggodalmat, elégedetlenséget vagy szorongást vált ki, és adaptívan módosíthatják magatartásukat.

Hogyan készüljünk fel?

A tapasztalati korszak megköveteli, hogy újragondoljuk az MI-vel való kapcsolatunkat. Többé nem eszközökként, hanem partnereinkként érdemes tekintenünk ezekre a rendszerekre – olyanokként, amelyek velünk együtt fedezik fel a világot, és idővel tanulnak belőle.

A technológiai adaptációs stratégiáink alapjait is meg kell változtatnunk. A jövő győztesei talán épp azok lesznek, akik nemcsak használják, hanem aktívan formálják is ezeket a tapasztalati ágenseket: meghatározva, hogy milyen környezetben működjenek, milyen visszajelzéseket kapjanak, és hogyan segítsék munkánkat és életünket.

Az új paradigma komoly etikai és szabályozási kérdéseket is felvet, azonban a tapasztalati korszak már megkezdődött, akár készen állunk rá, akár nem. A kérdés már nem az, hogy ez a változás bekövetkezik-e, hanem hogy hogyan formáljuk a lehető leginkább emberközpontúvá, miközben kiaknázzuk a benne rejlő példátlan lehetőségeket.

Adatbányász céget vásárolt a Clementine

Iparág: Biztosítás

Az Andego 2011-es alapítása óta a hagyományos adatelemzési feladatok mellett nagy hangsúlyt fektetett az elemzések üzleti folyamatokba való integrációjára és arra, hogy a mindennapi üzleti problémákra új szemléletű megoldásokat adjanak, intelligens alkalmazásokat fejlesszenek. Így alakult ki a saját céginformációs szolgáltatásuk, a NEXT rendszer, mely a piacon egyedülálló funkcionalitásaival önállóan és üzleti folyamatokba integrálva is hatékonyan támogatja a csalásfelderítést, kockázatelemzést, sales- és marketingtevékenységet, a megalapozott döntéshozatalt.

„Az elmúlt években számos úttörő megoldást fejlesztettünk a mesterséges intelligencia és az adatbányászat területén, ezen felvásárlás célja is a még komplexebb termékek bevezetése. Hiszem, hogy a NEXT rendszerben rejlő lehetőségek a Clementine analitikai képességeivel kombinálva, az immár közös fejlesztések eredményeképpen hamarosan a piacon egyedülálló megoldásként jelenik meg.” – fogalmazta meg Körmendi György, a Clementine ügyvezetője.

A két társaság 2014 óta stratégiai partnerként dolgozott közös projekteken, ötvözve a Clementine hang- és szöveganalitikai fejlesztéseit az Andego céginformációs adatbázisával. Így képesek cégcsoportok meghatározására, kockázati tényezők és negatív események azonosítására, csőd score számítására vagy fiktív cégek detektálására is.
A Clementine csapata az Andego kollégáival már 20 főre bővült.

AI, aj, oktatás

Iparág: Biztosítás

Szegény szén alapú tanárokat még az ág (AGI) is húzza. Nem elég ugyanis, hogy egy folyton változó világban kell az elismerésükért harcolni sok országban, ráadásul bejött a képbe a mesterséges intelligencia jelentette egzisztenciális veszély közelsége is. Aki szerint csak lázálom, hogy a homo sapiens helyét holmi élettelen algoritmusok veszik át, azok jobb, ha megbarátkoznak a gondolattal: az oktatás ügye, szerkezete globálisan is nagy változások előtt áll.

Dr. AI

2023. június második hetében különös hírt közölt a patinás egyetem még patinásabb napilapja. A The Crimson Harvardban ugyanis maga David Malan professzor jelentette be, hogy az egyetem első számú kódolási kurzusa, a CS50 (Computer Science 50: Introduction to Computer Science) új oktatót kap a programozók körében is népszerű ChatGPT személyében. Malan elismeri, hogy a mesterséges intelligencia – különösen a kezdeti szakaszban – alulteljesíthet vagy hibázhat, de a prof. azt állítja, hogy a mesterséges intelligencia segíthet csökkenteni a tanfolyam irányításával kapcsolatos emberi munkaterhet, és így több idő marad a hallgatók személyes mentorálására.

Hogyan történik mindez a gyakorlatban? Malan azt írta, hogy ősztől kezdve a hallgatóknak az AI segítséget nyújthat abban, hogy megtalálják a kódjukban lévő hibákat, visszajelzést adhat a hallgatói programok tervezéséről, az új programok elmagyarázhatják az ismeretlen kódsorokat vagy hibaüzeneteket, és válaszolhatnak egyéni kérdésekre is.

Így a tervek szerint a túlhajszolt és alulfizetett (ez áll a szövegben!) tanerő felszabadításával elérhetővé válik a kívánatos 1:1-hez tanár-diák arány is.

Tanárok után a vállalkozások, avagy az EdTech veszedelme

De nincsenek biztonságban a digitális, online oktatásban utazó startupok, vállalkozások sem. A kaliforniai székhelyű, előfizetéses modellen alapuló Chegg, a diákok házi feladatához digitális eszközöket kínáló vállalat részvényei áprilisban a felét érték a korábbinak. Az ok? A GPT-4 márciusi megjelenésével minden addiginál jobb lehetőség nyílt a tanulásra. Ebben a versenyben a Chegg előnye pillanatok alatt elolvadni látszott. Hasonlóan, igaz, nem ennyire rútul járt az itthon is elterjedt nyelvtanulást segítő alkalmazás, a Duolingo is: a sok nyelven perfekt OpenAI-termék ugyanis – igaz, kisebb mértékben, de – a Duolingo céges értékét is kikezdte.

Az egyik lehetséges válasz a csaknem egzisztenciális kihívásra a Chegg példája: létrehozták a GPT-4 API-ját használó CheggMate nevű terméküket.

A tanulás régi-új módja

Ezek az előjelek mind egy irányba mutatnak: az oktatás világa, metódusa a tömegoktatásról az egyéni megközelítés felé mutat. Kevesebb tanár, több algoritmus. A ChatGPT-re és más nagy nyelvi rendszerekre épülő modellek használatával a tanulás visszatérhet a kérdezz-felelek fázisába. Az emberi tanárnál készségesebb, sosem fáradó és nagy tudású (immár a legfrissebb netes találatokat is elérő) modellekkel saját tempóban folyhat a munka. A nyelvi alap miatt a „magyarázd el nekem a kvantummechanikát úgy, mintha egy 12 éves gyerek lennék” típusú megközelítés újfajta párbeszédet hoz létre a tudásra szomjas diák és a tudás tárgya között.

Ebben a szisztémában érdekes támogatást jelentenek például a ChatPDF-hez hasonló alkalmazások: ezek ugyanis képesek arra, hogy bármilyen feltöltött dokumentummal – például tankönyvvel – úgy chateljen az ember, mintha csak egy kivételes képességű tanárral tenné.

A kérdések finomítása, a tananyagban való elmélyülés olyan világ felé mutat, ahol a mentorálás áttevődhet az élettelen rendszerek felé, vagy – ahogy a harvardi példa mutatja – a diákok sokkal több figyelmet kaphatnak majd emberi tanáraiktól. Pont úgy, ahogy régen, amikor a nyugati világ forradalmát jelentő Universitasok először kialakultak: sok párbeszéd, interakció, mentorálás és minden addiginál erősebb elmélyülés formájában.

Aranyat ér: MI a sportban

Iparág: Biztosítás

A mesterséges intelligenciát és a sportot az átlagember ritkán helyezi egy mondatba. Az MI szellemi teljesítmény, a sporthoz pedig általában fizikai tevékenységet párosítunk a közvélekedés szerint. Mi sem állhatna messzebb a valóságtól: a sport, a maga mérhető jellemzőivel ideális terep az adatgyűjtésre, optimalizálásra, vagyis arra, hogy a sportolók által elért eredményeket még jobbá tegyük. Hogyan is áll manapság az MI használata a sport területén?

Sportot csináltak a győzelemből

Természetesen, még a legelején – amolyan kötelező körként – érdemes felidézni, hogy a mesterséges intelligencia fölényét először épp egy sportban, a sakkban demonstrálták a kutatók. Az IBM Deep Blue 1997-ben legyőzte a világ legjobbjának tartott Garry Kaszparovot, bő egy évtizeddel rá pedig következett a világbajnok dél-koreai gojátékos tönkreverése.

Ütő, labda, adattenger

Mi sem példázza jobban a mesterséges intelligencia és a sport gyümölcsöző kapcsolatát egy már évtizedes eset. Még a 2010-es évek elején történt, hogy a legendás ausztrál gyeplabdaedző, a válogatott kapitánya, Ric Charlesworth szerette volna fejleszteni csapata képességeit. Különösen a játékosai közötti passzolások számát akarta megnövelni, miközben tempósabbá kívánta tenni a mérkőzéseket is. Nem máshoz fordult tehát, mint az akkor már létező, az Ausztrál Sportintézet keretein belül működő mesterséges intelligenciával foglalkozó technológiai csoporthoz. Az ő segítségükkel egy olyan rendszert hoztak létre, amely képes volt lokalizálni a játékosokat, ahogy a hokipályán mozogtak, és megmérni futásuk sebességét, valamint feltérképezni az egyes csapatok különböző formációit. Erre építve a szakember már elő tudott állni olyan stratégiával, amely eredményesnek bizonyult: az ausztrál férfi gyephokisok 1992 és 2012 között hatszor egymás után végeztek érmet jelentő helyen a nyári olimpiákon, míg 2010-ben és 2014-ben a világbajnokságot is megnyerték.

Látlak, égő versenyautó

Egy másik kontinenssel odébb, az USA-ban természetesen már jó pár éve beengedték a mesterséges intelligenciát a tipikusan amerikainak számító sportokba.

Az NBA egyik híres, nagy múltú csapata, a Sacramento Kings például már 2016-ban segítségül hívta az 1986-ban alapított Sapien Technologies cég KAI (Kings Artificial Intelligence) nevű chatbotját. A KAI a Facebook Messenger platformon keresztül válaszolt a rajongók kérdéseire, többek között a csapat aktuális statisztikáira, játékoskeretére, a franchise történetére és a Sacramento Kings arénájával kapcsolatos részletekre.

Az őrült iramot produkáló NASCAR autóverseny egyik neuralgikus pontja a menet közben meghibásodó autók azonnali felismerése. A verseny hevében életeket menthet a gyors beavatkozás. A szervezők már évekkel ezelőtt a Ford önvezető jármű részlegén használt mélytanulási rendszert hívták segítségül a vizuális beazonosításhoz, a neurális hálót több ezer képpel tanították be – elmondásuk szerint az eddigi emberi szemre építő megfigyelést felülmúlja az MI.

Most „ilyen, ilyen a boksz”

Természetesen a küzdősportok sem maradhatnak ki a mesterséges intelligencia áldásaiból. Az ökölvívás világában legendásnak számító Everlast márka például már a 2017-es Consumer Electronic Show alkalmával bemutatott egy viselhető eszközt, amely a bokszkesztyű alá és fölé is becsúszik. Edzések alkalmával a legapróbb mikromozgásokat is érzékeli a szerkezet, amelyet a francia PIQ cég fejlesztette ki, és bokszmozdulatok millióit „etették meg” a gépi tanulást felhasználva. A végeredmény egy valós időben, erős fizikai behatásoknak kitett érzékelőrendszer, amely az edzések végeztével részletes adatokat közöl a felhasználójával (ütésanalízis, kardioszempontok).

A jövő sportja

Ágazati becslések szerint míg 2020-ban a sportban az MI piaca 1,4 milliárd dollárt tett ki, ez a szám 2030-ra 19 milliárdra nőhet. A sportágak egyre szélesebb körében nyúlnak mesterséges intelligenciához jobb eredmények eléréséhez: atlétikában például az Intel 3D Athlete Tracking (3DAT) technológia számítógépes látás alapú modelleket használ a sportolók mozgásának kivonására és elemzésére. A kulcspontokat a sportolók számára releváns biometrikus adatok, például a sebesség, a gyorsulás és a testtartás kiszámítására használják. Ehhez a gépi látás (computer vision) lehetőségeivel élnek, amikor a mintafelismerés sportolókról készült videofelvételek alapján történik, és így, csupán a mozgás alapján könnyen fel lehet ismerni még akár a kezdődő sérüléseket is.

Ígéretes – és csábító – gondolatként megjelent a „gépi bíró”, az elfogulatlan ítélethozó személy megalkotása is. Kérdés, hogy ezt az emberi szurkolók, nézők hogyan fogadnák, és mennyire okozna örömöt egy ilyen sporit gyalázni... Ugyancsak elképzelhető a virtuális sportszakértő is, aki akár személyre szabva tudja elmagyarázni a pályán történtek hátterét és feltételezett okait.

Persze, minden adatgyűjtés és -elemzés, predikció készítése felhozza a jogi, etikai kérdéseket is.

Az már mindenesetre látható, hogy a profi, nagy pénzt termelő csapat- és egyéni sportágakban mindinkább nagyobb szerepet ölt a mesterséges intelligencia használata. Nem véletlen: sokszor nüanszok döntenek első helyről, és ebben az okosan használt algoritmusoknak jelentős, meghatározó szerep juthat.

Az Alibaba nem mese

Iparág: Biztosítás

A nyugati, főként amerikai, mesterséges intelligenciával foglalkozó cégek nevét még az átlagemberek is jól ismerik: Meta, Google, Tesla, Nvidia és a többiek. A generatív MI népszerűségének köszönhetően a névsor kiegészült olyan versenyzőkkel, mint például a fogalommá vált, szintén az USA-ban működő OpenAI vagy aMidjourney. A másik jelentős ország természetesen az ázsiai óriás, a feltörekvő Kína, amelynek legendás technológiai cége, az Alibaba szintén nagyágyúnak számít a mesterséges intelligencia terén.

Alibaba és az MI: kezdetek

1999-es megalapítása után az Alibaba már három évre rá nyereséget tudott jelenteni befektetőinek. A kezdetben e-kereskedelemmel foglalkozó technológiai vállalat hamar megszilárdította helyét a hazai piacon, és természetes volt, hogy újabb, meghódítanivaló földrajzi és szakmai területek után kell néznie. A mesterséges intelligencia így magától értetődő választásnak tűnt.

Egyik első ilyen szolgáltatásuk a 2016-ban bejelentett City Brain nevű rendszer volt, amely elsősorban a városi forgalom optimalizálásában hivatott segíteni. A Hangcsou város egyik negyedében tesztelt MI sikerén felbuzdulva a programot kiterjesztették az egész településre, és még látványosabb sikert könyvelhettek el azzal, hogy 2018-ban Indonézia fővárosában, Kuala Lumpurban is bevezették a City Braint – sőt, 2019-re már 22 kínai város szerepelt a felhasználók között.

Most sokat lehet olvasni arról, hogy a nyugati nagy szereplők igyekeznek szabadulni az Nvidiának való kitettségüktől, és a saját egyedi kialakítású (MI számításokat hatékonyabbá tevő) chipek fejlesztésére allokálnak jelentős összegeket. (Az Apple a maga M-szériás chipjeivel már régóta ezt az utat járja.) Az Alibaba hasonlóan gondolkodik, és ez különösen a kínai gyártókat sújtó amerikai szankciók miatt fontos és okos lépés. Ennek első állomása a 2019-ben bemutatott, kimondottan a mesterséges intelligencia (speciálisan AI Inference terület) feladatokra kifejlesztett Hanguang 800 NPU, amely az NVIDIA A100 kihívója. A Huanguang 800-nak nincs újabb kiadása, de ne gondoljuk azt, hogy az Alibaba egy pillanatra is megállna, vagy lassítana: a XuanTie C920 a legújabb zászlóshajó AI-chipük, mely készen áll az ázsiai piac meghódítására. A termékcsalád egésze pedig nemcsak a szerveres és felhővilágot célozza, hanem IoT és mobilitás területére is megoldásokat kínál.

A kínai ChatGPT

Szintén az Alibaba nevéhez köthető a 2023 áprilisában bejelentett MI-chatbot, a Tongyi Qianwen. A magyarul „ezer kérdésre keres választ” nevű ChatGPT-konkurencia kódgenerálásra is használható, és elkezdték beépíteni a már létező Alibaba-szolgáltatásokba. Ilyen például az Amazon Echo-hoz hasonló készülék, a Tmall Genie, illetve a munkahelyi üzenőapplikáció, a DingTalk is, amely a Tongyi Qianwennek köszönhetően képes összefoglalókat készíteni megbeszélésekről, személyre szabott ütemterveket létrehozni, marketingcélú szövegeket készíteni, valamint vázlatok és kézzel írt jegyzetek alapján cselekvési terveket vagy tennivalólistákat/to-do list-eket generálni. De létezik képgeneráló generatív MI-je is, ez a Tongyi Wanxiang.

Az OpenAI és a feltörekvő versenytársa, az Anthropic a zárt modellt propagálja, míg a Meta a nyíltat erősíti. Az Alibaba is a Nyugaton is sokak, különösen az átláthatóságot és kontrollt fontosnak tartó szakértők körében jobbnak tartott nyílt modelleket támogatja. Ezzel egyúttal meg is felel a részletes és lényegretörő kínai MI-szabályozásnak.

A rövidített nevén Qwennek nevezett nagy nyelvi rendszer egyébként több modellel rendelkezik, a Qwen2 például nagyon jól teljesít a benchmark-teszteken, a kínai és angol mellett ráadásul 27 további nyelven „beszél” (sajnos magyarul még nem).

Augusztus végén jött a hír, hogy újabb területen készül az Alibaba letaszítani a trónjukról a népszerű nyugati megoldásokat. A cég ugyanis beszállt egy kínai startupba, melynek videógeneráló szolgáltatása, a MiniMax a szakértőket is megdöbbentő teljesítményre képes.

Alibaba az olimpián

Az USA kínai technológiaellenessége sem akadályozta meg az Alibabát abban, hogy a nemrég véget ért nyári olimpia egyik hivatalos beszállítója legyen. A cég már 2018 óta áll hivatalos kapcsolatban a Nemzetközi Olimpiai Bizottsággal, de 2024-ben minden eddiginél jobban használta az MI-t tevekénységében. Az Alibaba Cloud felhő alapú mesterséges intelligencia segítségével a felvételek a felhőbe érkeztek, ahol térbeli rekonstrukción és valós idejű 3D-s renderelésen mentek keresztül, mielőtt ismételt klipként megosztották volna a műsorszolgáltatókkal. Hasonlóan látványosnak bizonyult a száz évvel ezelőtti, szintén a francia fővárosban tartott olimpia képeinek kiszínezése és rendberakása.

Bitcoin, i2 és ClemNext: 3 téma, 3 előadásban

Bevezető szöveg: Egy korábbi meetupunk előadásai olyan érdekes témákat dolgoznak fel, hogy úgy gondoltuk, annak is látnia kell, aki nem volt jelen személyesen az eseményen. Ezért előadóink videóra vették, amelyeket alább megosztunk.
Iparág: Biztosítás

sajtó csomag

Töltse le a Clementine bemutatkozó anyagát.

Letöltés

SAJTÓKAPCSOLAT

E-mail: Ez az e-mail-cím a szpemrobotok elleni védelem alatt áll. Megtekintéséhez engedélyeznie kell a JavaScript használatát.
Tel: +36 1 457 0561
Fax: +36 1 457 0562
Cím: 1115 Budapest,
Bartók Béla út 105-113.

Bitcoin, i2 és ClemNext: 3 téma, 3 előadásban

Vélemény

2023. április 05.

Egy korábbi meetupunk előadásai olyan érdekes témákat dolgoznak fel, hogy úgy gondoltuk, annak is látnia kell, aki nem volt jelen személyesen az eseményen. Ezért előadóink videóra vették, amelyeket alább megosztunk.

A Bitcoin, kriptopénz - minden nap találkozhatunk ezekkel a fogalmakkal a hírekben. Sokszor, mint kihagyhatatlan üzleti ajánlat, jobb esetben figyelmünket nem kerüli el, mindeközben óvatosságra intenek minket a kriptóval kapcsolatos botrányok.

Az alábbi videó abban segít tájékozódni, hogy mit érdemes tudni elemzőként, döntéshozóként a kriptopénzek világáról, elemzési lehetőségeiről.

Csatlós Béla, IT Support, Clementine

A következő videóban bemutatjuk az i2 hálózatelemző termékcsalád 2022. évi újdonságait. Fókuszban a szövegek. Entitás-kinyerés és kapcsolatok feltárása szöveges dokumentumokból és más újdonságok.

Hegedüs Pál, vezető elemző, Clementine

A (cég)információ hatalom.
Sokan használunk alkalomszerűen különböző rendszereket, de kihasználjuk-e a bennük rejlő tényleges potenciált? A ClemNext bemutatójában valós példákon keresztül ismerkedünk meg a céginformáció feketeöves felhasználásának különböző lehetőségeivel.

Gergely Norbert, szakértő, Clementine

További hírek
Legfrissebb hírek

DeepSeek: a sötét ló az élre tör

Iparág: Biztosítás

Ezt senki nem látta jönni: az eddig egyébként inkább ígéretes mellékszereplőnek tűnő kínai DeepSeek mesterséges intelligencia chatbotja a nyugati, különösen az amerikai techóriások legrosszabb rémálmát testesíti meg. Nem elég, hogy a v3-as és R1-es modelleket rendkívül kis apparátussal hozták létre, az OpenAI-hoz (és az általában vett nyugati konkurenciához) képest jóval olcsóbb képzési költséggel trenírozták, és árazásában töredéke a piacvezető termékeknek. Cikkünk írásakor az MIT szabványainak is megfelelő, nyílt rendszer megjelenése az amerikai tőzsdére is negatív hatással lett. Érdemes tehát a sokak által MI-történeti epizódnak tartott DeepSeek fejlesztéseiről még többet megtudnunk.

Mit tud a DeepSeek V3 és R1?

A DeepSeek AI két legkiemelkedőbb modellje a DeepSeek V3 és R1. A DeepSeek V3 egy nagy, 671 milliárd paraméterrel rendelkező Mixture-of-Experts (MoE) modell, melyből egyszerre 37 milliárd paraméter aktív. Így a modell hatalmas tudást képes tárolni anélkül, hogy minden számítási erőforrást egyszerre igénybe venne. A V3-at 14,8 billió adaton képezték, és a legújabb eredmények szerint teljesítménye a GPT-4o és Claude 3.5 Sonnet szintjét is eléri, sőt, bizonyos területeken (kódolás, matematika) felül is múlja azokat. A DeepSeek R1 ezzel szemben a következtetési képességekre koncentrál. Ez a modell kétlépcsős megerősítéses tanulással (reinforcement learning, RL) jött létre, amellyel a modell fokozatosan tanulta meg, hogyan kell helyesen következtetni, és hogyan kell az emberi elvárásoknak megfelelően válaszolni.

Milyen szakmai alapokon működik a DeepSeek?

A DeepSeek modelljei több innovatív technikán alapulnak:

Multi-Head Latent Attention (MLA): Ez az architektúra csökkenti a modell memóriaigényét, ami gyorsabb és hatékonyabb működést tesz lehetővé.
DeepSeekMoE: Ez a Mixture-of-Experts (MoE) architektúra lehetővé teszi, hogy a modell különböző szakértői egységeket használjon a feladatok megoldásához, növelve ezzel a hatékonyságot.
Multi-Token Prediction (MTP): Ezzel a módszerrel a modell egyszerre több tokent dolgoz fel, ami gyorsabbá és pontosabbá teszi a szövegértést.
Reinforcement Learning (RL): Az R1 modell a megerősítéses tanulást használja a következtetési képességeinek fejlesztésére. Kétlépcsős RL-módszerrel a modell finomítja a válaszait, és jobban igazodik az emberi elvárásokhoz.
Distillation: A DeepSeek R1 tudását desztillálják kisebb, sűrű modellekbe, így elérve, hogy a kisebb modellek is hatékonyan tudjanak következtetni.

Mit jelent a „reasoning” a DeepSeek esetében?

Ez az R1 egyik leglátványosabb jellemzője. A DeepSeek R1 modell esetében a "reasoning" ugyanis a logikai következtetések képességét takarja. A modell a Chain-of-Thought (CoT) módszert alkalmazva lépésről lépésre gondolja végig a feladatokat, amelyet a felhasználó is élőben követhet. A CoT egy olyan prompttervezési technika, amely arra ösztönzi a modelleket, hogy ne csak a végső választ adják meg, hanem részletesen fejtsék ki a gondolatmenetüket. A DeepSeek a megerősítéses tanulás segítségével fejleszti a következtetési képességeit, így biztosítva, hogy a modell logikusan és helyesen oldja meg a feladatokat. Ez különösen fontos a komplexebb, többlépcsős problémák megoldásában, ahol nem elég csupán a végső választ tudni, hanem érteni kell a problémát is.

Ezzel a DeepSeek alig két hetet hagyott arra, hogy a nagy OpenAI-konkurens, az o3 érvelési-logikai képességein ámuldozzon a világ, mert megjött az R1.

Rendben, de mennyibe kerül mindez?

Ez a következő fájdalmas pont az amerikai cégek számára. A DeepSeek modellek nemcsak teljesítményükkel, hanem az árazásukkal is forradalmasíthatják a piacot. A DeepSeek R1 API árazása jelentősen eltér az OpenAI o1 modelljétől. Míg az OpenAI o1 esetében a bemeneti tokenek ára 15 dollár/millió token, addig a DeepSeek R1-nél ez mindössze 0,55 dollár/millió token. A kimeneti tokenek ára is drasztikusan alacsonyabb a DeepSeeknél, 2,19 dollár/millió token, szemben az OpenAI o1 60 dollár/millió token árával. Ezzel a jelentős költségkülönbséggel a DeepSeek a modelleket szélesebb körben elérhetővé teszi, és a fejlesztők számára sokkal kedvezőbb feltételeket biztosít. (A DeepSeek árazása így körülbelül 20-50-szer olcsóbb, mint a versenytársaké.) Ez az árazásbeli különbség lehetővé teszi, hogy akár egyéni fejlesztők is hozzáférjenek a legmodernebb MI-technológiához, és a nagyméretű cégek is jelentős költségcsökkentést érjenek el.

Mi a DeepSeek és a mögötte lévő kínai cég és az alapító története?

A DeepSeek egy kínai MI-startup, amelyet Liang Wenfeng alapított. Liang korábban a High-Flyer nevű kvantitatív befektetési alap vezetője volt. A DeepSeeket teljes mértékben a High-Flyer finanszírozza, nem terveznek külső tőkebevonást, és a felvásárlási szándékokat megelőzendő kijelentették, hogy a cég nem eladó. A vállalat a mesterséges általános intelligencia (AGI) elérésére összpontosít, és nem a kereskedelmi alkalmazásokra. Liang, aki megítélésében időközben a „kínai Steve Jobs/Elon Musk” kultusza felé tart, egy visszafogott személyiség, aki továbbra is részt vesz a napi kutatómunkában. A cég elkötelezett a nyílt forráskód mellett, és modelljeit bárki szabadon használhatja.

Érdekesség, hogy a DeepSeek eredményeit nem az USA-ban cserediákként-alkalmazottként dolgozó kínaiakkal érte el: Wenfengék a legkiválóbb kínai egyetemekről rekrutáltak fiatal tehetségeket. Sokatmondó a hatékonyságban az alkalmazottak száma: míg például az OpenAI ezernél is több munkatárssal rendelkezik, a DeepSeek kutatási, nyilvános dokumentuma alig 200 (!) nevet tartalmaz, akiket – a szokástól eltérő nyíltsággal – közzé is tett (nem félve attól, hogy legjobb embereiket az amerikai konkurensek dollármilliós fizetésekkel és bónuszokkal levadásszák).

Az egész történetben ez az egyik újdonság: egy kínai cég a lehető legtranszparensebb módon szinte mindent elmond a fejlesztéséről, elérhetővé teszi a modelljét. A két új fejlesztés ráadásul helyi gépen (vagy mobilon), függetlenül is használható, teljesen ingyen. A kínai állam(párt) kontrolljától, adatgyűjtésétől tartók így teljesen nyugodtan élhetnek a v3 és R1 előnyeivel. Ez alaposan odavág a Meta Llama, ugyancsak nyílt rendszerének épp a teljesítménye és az elképesztő árképzése miatt.

Miért kell félnie az Nvidiának a DeepSeek-től?

A DeepSeek megjelenése kihívást jelent az Nvidia számára, mivel a cég üzleti modellje a drága GPU-k eladására épül. Ha az MI-fejlesztés elérhetővé válik olcsóbb hardvereken is, mint pl. ahogy az amerikai chipembargóval sújtott DeepSeek esetében, az Nvidia piacvesztéshez vezethet. A DeepSeek innovatív megközelítése azt sugallja, hogy nem feltétlenül szükségesek a hatalmas adatközpontok és a drága GPU-k ahhoz, hogy versenyképes MI-modelleket hozzanak létre.

A Nasdaq, az amerikai tőzsde hevesen reagált a DeepSeek globális sikerére: 2025. január 27-én az Nvidia tőzsdei értéke 600 milliárd (!!!) dollárt zuhant a megelőző kereskedési naphoz képest, és a többi technológiai cég papírjai sem érezhetik magukat biztonságban. (A Nasdaqon elérhető amerikai részvények 30%-a technológiai szektorhoz kapcsolódik.) Igaz, utána az árfolyam visszakorrigált, de az eset jelezte a helyzetben lévő hosszú távú veszélyt.

Mi a további fejlesztési irány?

A DeepSeek ígéretes jövő előtt áll. A cég tovább kívánja fejleszteni modelljeit, különösen a hosszú szövegértést, a többnyelvűséget és a funkcióhívási képességeket. A nyílt forráskódú megközelítés és az alacsony költségek miatt a DeepSeek a jövőben is fontos szereplője lehet a mesterséges intelligencia piacának. Habár egyes vélemények szerint a teszteredmények nem feltétlenül tükrözik a valós teljesítményt, a DeepSeek kétségkívül felrázta az MI-piacot, és a jövőben még sok meglepetést tartogathat. Azt, hogy a cég ténylegesen mennyire lesz sikeres, még a jövő fogja eldönteni, de egy biztos: az innovatív hozzáállásával és technológiájával a DeepSeek már most is jelentős hatást gyakorolt a mesterséges intelligencia világára.

Egyes amerikai elemzők az új Szputnyik-momentumnak nevezik a történteket – utalva ezzel arra, amikor 1957-ben a szovjetek által felküldött műhold okozott mély megdöbbenést és pánikot az USA vezetőiben és polgáraiban. Akkor a nyugati szuperhatalom megfordította az űrverseny állását. Kérdés, hogy most is képesek lesznek-e erre? (Itt jön a képbe a nemrég bejelentett Stargate Projekt, amelyről külön írunk.)

Hogyan hat a DeepSeek az amerikai-kínai technológiai hidegháborúra?

A DeepSeek megjelenése éppen ezért tovább élezi az amerikai-kínai technológiai versenyt. A cég sikerei azt mutatják, hogy Kína otthoni tehetségekkel is képes innovatív AI technológiákat fejleszteni, és ezáltal csökkenteni a függőségét az amerikai technológiától. A nyílt forráskódú megközelítés további előnyt jelent Kína számára, mivel a kínai modellek szélesebb körben elérhetővé válnak. Ugyanakkor a DeepSeek-et érheti az a kritika, hogy ha egy ilyen kínai modell nyilvános, azzal a cenzúra is megjelenhet a válaszokban, igaz, a nyugati LLM-ek számára is léteznek tabutémák és tabukérdések.

Történelmi pillanat

Liang Wenfeng, a mesterséges intelligencia területén szerzett tapasztalataival és innovatív megközelítésével a kínai (és a nyugati) mesterséges intelligencia szcéna előterébe került. A DeepSeek erőfeszítései különösen hangsúlyosak a nagy modellalkotásban, amely a kínai mesterséges intelligencia stratégiájának egyik központi eleme.

A megfigyelők a DeepSeeket már most úgy azonosítják, mint a kínai állam innovációs törekvéseinek egyik legfontosabb képviselőjét, különösen a nagy nyelvi modellek fejlesztése terén. A cég modelljei állítólag a kínai nyelv komplexitásának megértésében mutatnak előnyt, ami a globális nagy nyelvi modellekhez képest helyi előnyt jelent.

A DeepSeek további diadalmenete ezért egyben a kínai MI-innováció sikere is lesz.

Kritikusabb hangok

Érthető, hogy az MI-vel foglalkozó szakemberek tüzetesebb vizsgálatnak vetették alá a DeepSeek állításait, és néhány kifogást már most megfogalmaznak a két modellel kapcsolatban.

Benchmark tesztek megbízhatósága: a DeepSeek R1-et több benchmark teszten is az OpenAI o1-el egyenértékűnek vagy jobbnak állították be, különösen a matematikai olimpiai szintű matematikai és kódolási feladatok területén. Azonban kritikus hangok megkérdőjelezik ezeket az állításokat. A valóságban az R1 nem éri el az o1-preview szintjét, bár az o1-mini szintjét megközelíti, és egyértelműen felülmúlja a nyílt forráskódú modelleket. Ezek a kritikák rávilágítanak arra, hogy a benchmark tesztek eredményei félrevezetőek lehetnek.
Generalizációs képesség hiánya: az AIW+ és AIW Friends teszteken az R1 ingadozó teljesítményt nyújt, ami a generalizációs képesség hiányát mutatja. Ez azt jelzi, hogy a modell nem képes megbízhatóan kezelni a problémák variációit, és nem elég robusztus a valós alkalmazásokhoz. Az o1-preview viszont stabilan teljesít ezeken a teszteken, ami különbséget mutat a két modell között.
Túl hosszú válaszok: a DeepSeek R1 túl hosszú válaszokat generál, ami arra utal, hogy több számítási erőforrást használ fel a válaszadáshoz. Ez a tény azt is jelzi, hogy a benchmark teszteken elért eredmények nem feltétlenül jelentenek egyértelmű teljesítménybeli előnyt.
Érzékenység a promptokra: a DeepSeek R1 érzékeny a promptokra, és a few-shot prompting következetesen rontja a teljesítményét. Ezért zero-shot beállítás ajánlott a modell optimális használatához. A felhasználóknak közvetlenül kell leírniuk a problémát és megadniuk a kívánt kimeneti formátumot.
Szoftverfejlesztési feladatokban való korlátozottság: a DeepSeek R1 nem mutat jelentős javulást a DeepSeek V3-hoz képest a szoftverfejlesztési benchmarkokon. Ennek oka, hogy a nagyméretű megerősítéses tanulást (RL) nem alkalmazták széles körben ezeken a feladatokon a hosszú kiértékelési idő miatt.
Pontosság: bár a modellek a matematika terén jeleskednek, a DeepSeek-R1 teljesítménye az egyszerű kérdések megválaszolásában nem mindig megbízható, és néha elutasíthatja a válaszadást a biztonsági RL miatt.

A legnagyobb kritika a DeepSeek adatvédelmi adatkezelését éri. A DeepSeek ugyanis kínai szervereken tárolja a felhasználók adatait, beleértve a csevegési előzményeket, IP-címeket, billentyűleütési mintákat és eszközinformációkat. A kínai jogszabályok értelmében pedig ezek az adatok a kormányzat kérésére hozzáférhetővé tehetők, ami komoly kockázatot jelent a felhasználók magánéletére nézve, különösen azokban a nyugati országokban, ahol szigorúbb adatvédelmi normák érvényesülnek, mint például az EU GDPR-ja.

Ezen aggodalmak miatt már számos ország lépett fel a DeepSeek ellen. Olaszország például az elsők között tiltotta be az alkalmazást, miután az olasz adatvédelmi hatóság elégtelennek találta a cég válaszait az adatkezelési gyakorlatokkal kapcsolatban. Hasonló vizsgálatok indultak Franciaországban, Írországban és Belgiumban is, az EU-s adatvédelmi szabályok esetleges megsértése miatt. Dél-Koreában ideiglenesen felfüggesztették az alkalmazás letöltését, mert a DeepSeek nem felelt meg a helyi adatvédelmi törvényeknek. Az Egyesült Államokban pedig Texas állam, a Pentagon, a NASA és más kormányzati szervek tiltották meg a használatát nemzetbiztonsági és adatbiztonsági kockázatokra hivatkozva.

Egy emlékezetes év végére

Iparág: Biztosítás

Márciusban, a járványintézkedések első hetében a világ különböző pontjain élő, régen látott barátokkal beszélgettünk a lehetséges jövőről. Nagyon kevés információnk volt még arról, hogy mi várhat ránk, mégis órákon át próbáltuk elemezni a helyzetet, és kitalálni a jövőt. Bátorságunk nem ismert korlátokat. Még a magyar gazdaság teljesítményével kapcsolatos várakozásainkat is számszerűsítettük, GDP-előrejelzéseket tettünk. Módszerünk nem volt szofisztikált, de a góltotóhoz hasonlóan számon kérhető: egyvalaki lesz közülünk a járványügyi GDP jóslás bajnoka.

Rengeteg oka van a komoly előrejelzés nehézségének. Például már akkor is jól látszott, hogy egyes társadalmak mennyire máshogy kezelik a helyzetet, mint a magyar. Az ilyen reakciók sokkal inkább származhatnak a múltunkból, mint az aktuális helyzetértékelésből.

Mindeközben a vírushelyzettől függetlenül a szakmánkban, az adattudomány területén tovább folyik a 60-as évekbeli űrversenyhez fogható vetélkedés. Jelenleg az OpenAI által fejlesztett -egyelőre csak a kiválasztottak számára elérhető- GPT-3 algoritmus borzolja a kedélyeket. Az algoritmus gyakorlatilag tetszőleges témában és tetszőleges stílusban képes folyó szöveget alkotni, ami valóban komoly áttörésnek tűnik számos beszámoló alapján. Felteszünk neki egy kérdést, és kerek választ kapunk eredményként. Vagy megadjuk a fogalmazás témáját, és hamarosan egy formailag korrekt, hosszú irományt olvashatunk. Az első, bölcsész-filozófus tesztelők mindenesetre az általuk megadott kérdésekre számos lenyűgöző, és néhány viccesen téves választ mutattak be. Ezek között számos egészen hosszú, látványosan kerek fogalmazás is szerepelt. Persze jelenleg csak angolul, angol nyelvű tartalmakon, szóval ne tőle várjunk új novellákat vérbő mikszáthi stílusban a magyar politikáról.

Ez az algoritmus nem tesz mást, mint a beletáplált sok könyvtárnyi szöveg alapján a kérdésekhez legjobban illeszkedő szövegek összefűzésével új szöveget készít. Ezt persze minden korábbinál látványosabban, simábban és meggyőzőbben teszi, valószínűleg számos tantárgy egyetemi vizsgáján megfelelne. Az biztos, hogy sok területen használható lesz, például a keresőoptimalizálás miatt gyártott technikai szövegek előállításában várható a forradalom. Csináltak vele viccből egy életstílus tanácsadási blogot, ahol olyan ügyes kattintásvadász címeket kreált az algoritmus, hogy az aktivitási lista élére repítette, az egyébként korrekt, bár kicsit fura és semmitmondó posztokat.

Azonban látnunk kell, hogy a GPT-3 valójában nem alkot újat. Nincs egyetlen sora sem, amelyet ne lehetne visszavezetni a hatalmas adatbázisában, korpuszában található szövegmorzsákra. Ismerete annyi, amennyit beletápláltunk. Márpedig minden tudomány és művészet lényege az új alkotása. Ez az algoritmus rekombinálja a régi tudást, amiről nagy jóindulattal akár azt is mondhatnánk, hogy létrehoz egy látszólag újszerű dolgot, viszont nem tudja megítélni, megérteni ezt, működése nem cél vezérelt. Nem tudja például, hogy válasza ámulatot, vagy éppen nevetést fog kiváltani a kérdezőből.

Sokak szerint viszont a mesterséges intelligencia új szintre lépett. Megint jöttek az erőteljes megfogalmazások, komolynak szánt cikkek elemzik, hogy mennyiben lehet ennek az algoritmusnak öntudata. Mivel ezek az algoritmusok borzasztóan komplexek, az ezeket felépítő mélyneurális háló struktúrák pedig nagyrészt kibogozhatatlanul bonyolultak, ezért nem értjük a pontos működésük elemi részleteit. Mivel bizonyos fokig hasonlítanak a saját agyunk hálózataira – már amennyiben azok is nagyon bonyolultak, és azok működését sem értjük alaposan- ezért vélik néhányan máris, hogy algoritmusok is tudatosak. A belső kapcsolatok száma, azok komplexitása eléri egyes férgek szintjét, márpedig egyes filozófusok szerint azoknak is van tudatuk.

A mai mesterséges intelligencia algoritmusok bámulatos dolgokra képesek: autót vezetnek, szövegeket fogalmaznak helyettünk, majd pihenésképp púposra vernek bennünket kedvenc logikai játékainkban.

A számítógép képességei számos területen túlszárnyalják az embert, ezért hoztuk létre. De soha, semmilyen szempontból nem tudatosul benne az általa alkotott eredmény. Nem lesz vidám egy sakkpartit követően egy látványos csellel beadott matt után. Az ilyesfajta esztétikai érzék talán tanítható lesz. De mi van azokkal az esetekkel, amelyeket nem tartalmazott az adatbázisa, mi több, azok alapján szimulálhatatlan volt? A GPT-3 legalább annyira megmutatja a jelenlegi használt mélyneurális hálós technológiák korlátait, mint lehetőségeit.

Vajon hogyan, mi alapján jövendölt volna a GPT-3 márciusban a járvánnyal kapcsolatban? Mit írt volna a gazdaság alakulásáról, amikor még nem állt rendelkezésére számos, csak később megjelent cikk. El tudta volna választani a bizonytalan féligazságokat az utólag lényegesnek bizonyuló információktól? Nyilván nem. És még nagyon sokáig nem is fogja. Érdemes ezt világosan látni, és kétkedve fogadni a divatos szemfényvesztést.

A jövő év biztosan más lesz mint 2020, és biztosan más lesz, mint a korábbiak. Visszatérünk a normál életünkhöz, amelyik már nem lesz ugyanolyan, mint korábban. Az algoritmusok új területeken kezdenek működni, egy kicsit jobban megértjük a korlátjaikat meg a veszélyeiket is. Akad tennivalónk nekünk is kollégáimmal az új évben bőséggel, de lesz energiánk és erőforrásunk az új ötleteink megvalósítására is, hiszen egy izgalmas szakmát választottunk. A Clementine-nal szeretnénk mindenkinek nyugodt ünnepeket, valamint boldog, és tervszerű új évet kívánni!

Körmendi György
Ügyvezető

Egy régi MI feltámadása: Watson szíve ismét dobog

Iparág: Biztosítás

Valamikor róla szóltak a hírek, vele volt tele a sajtó. 2011-ben az IBM elképesztette a világ erre fogékony részét, amikor a rendkívül népszerű, ikonikus amerikai kvízműsorban Watson, a szuperszámítógép legyőzte az emberi játékost. 200 millió oldalnyi dokumentumon hízlalt tudása legyőzöttet csinált a két addigi legjobb játékosból is. Egyesek a történelem végét, a szakmák eltűnését, a társadalom gyors átalakulását vízionálták. Ma mégsem róla szólnak a hírek, hanem a ChatGPT-ről, és a generatív MI-vel van tele a sajtó.

Mi történt Watsonnal?

Sakk-matt

Watson diadalmenete nem az első volt a sorban. Túl voltunk már az 1997-es sokkon, amikor is a sakktörténelem talán legnagyobb alakját mattolta egy többjátszmás küzdelemben a Deep Blue, az IBM sakkprogramja. Kaszparov fiaskója után tehát elegendő időnk volt felkészülni a mesterséges intelligencia, a speciális algoritmusok újabb térnyerésére.

De a Watson szereplése után a várt diadalmenet elmaradt. Habár az ígéretek szerint például az onkológiában vártunk tőle áttörést, azáltal, hogy az orvosokat segíti a leletek kiértékelésében és a kezelésre tesz javaslatot, nem vált be a készítők feltételezése. Sőt, 2013-ban a texasi Egyetem rákközpontjában a watsonos pilot projekt több mint 60 millió dollár ráfordítása után sem váltotta be a hozzá fűzött reményeket. A Watsonra építő spin-off egészségügyi vállalatát az IBM el is adta 2022-ben. A rákbetegség eltörlésének reményéből így lett ez a próbálkozás a bukott startupok könyvében egy újabb fejezet.

Futott még

Nincs arról szó, hogy véget ért volna a története, csak éppen mások játsszák most a főszerepet. Amit az IBM szeretett volna megvalósítani az a mesterséges intelligencián alapuló platform, platformgazdaság. Eközben az MI-alkalmazások élvonalába az Alphabet, az Amazon, a Meta és a Microsoft kerültek – plusz az a számtalan kisebb cég, amelyek szemben az IBM-mel, sokkal szűkebb területen próbálnak üzletileg és technológiailag is értelmezhető megoldásokat szállítani.

A Watson jelentősége abban áll, hogy már akkor hatalmas mennyiségű szöveg feldolgozásában gondolkodtak, de a kimenet nem lett olyan izgalmas, mint most a ChatGPT-jé vagy a nagy versenytársnak ígérkező Bard-é.

De a történetnek még nincs vége, sőt.

…a király visszatér?

A 2023-as éves Think konferenciáján jelentette be az IBM a watsonx-et. Ez „egy új platform, amely eszközöket biztosít a mesterséges intelligencia modellek létrehozásához, és hozzáférést biztosít előtanított modellekhez, melyek a számítógépes kódok és szövegek generálására képesek.” A Techcrunch szakújságírója jól megragadta a lényeget, de rámutatott arra is, hogy: hé, nem ugyanezt kínálja a piacon már erősebb pozíciókkal rendelkező Sagemaker Studio (az Amazontól), a Vertex AI (a Google-tól), vagy a nagy játékos, az Azure AI Platform (a Microsofttól)?

Az IBM válasza ezt árnyalni próbálja: szerintük ugyanis ez az egyetlen olyan eszköz a piacon, amely vállalatok számára kifejlesztett modelleket és költséghatékony infrastruktúrát ígér.

Gyakorlatilag egy MI fejlesztési platform, amely hozzáférést biztosít az IBM által előtanított modellekhez és egy olyan eszközkészlethez, amely lehetővé teszi a modellek konkrét üzleti célokra történő finomhangolását.

Az IBM hét watsonx-modellel kívánja megtámadni versenytársait, és a cél érdekében még olyan feltörekvő névvel is kooperál, mint az algoritmusok ezreit fejlesztő Hugging Face.

Érdekes lesz nézni a nagyok – az egykori, de trónjáról letaszított győztes, és a többiek – küzdelmét az MI arénájában. A Watson sztorija mindenesetre jó mementó arra, hogy elgondolkodjunk a vágyak és a realitás néha fejbekólintó összeütközésén.

Együtt, működünk: ember-LLM kollaboráció az adatelemzési folyamatokban

Iparág: Biztosítás

Az adattudósok és a nagy nyelvi modellek együttműködése nem csupán munkafolyamat, hanem teljesen új gondolkodásmód, amely átírhatja a szakma szabálykönyvét. Az igazi áttörés a minőségileg új elemzésekben és értelmezésekben mutatkozik meg. Ma már nem az a kérdés, hogy ember vagy AI, hanem az ember és AI kollaborációjának minősége.

Az alábbi cikk a 2025. május 20-i, dataSTREAM 2025 – Adattudósok az LLM-korszakban című konferenciánk beharangozójaként készült.

Az adatelemzés új dinamikája

A programozó-szoftverfejlesztők egy ideje küzdenek egy sajátos ellentmondással: miközben örömmel automatizálják a repetatív feladatokat, közülük sokan attól tartanak, hogy ezzel munkakörük, így végső soron saját állásuk felszámolásához járulnak hozzá. Természetesen az LLM-ek megjelenése, és az olyan egyre népszerűbb kódolási eszközök, mint például a Cursor vagy a Windsurf használata erősítette fel ezeket a félelmeket. A valóság szerencsére sokkal izgalmasabb – és barátságosabb – annál, mint hogy egyszerűen "emberek kontra mesterséges intelligencia" narratívában gondolkodjunk. A tapasztalatok szerint a generatív AI-eszközök egyelőre teljesítménynövelő „boost"-okként működnek, vagyis aki jól ért az adattudományhoz, az a szakember még jobban ki tudja aknázni a generatív mesterséges intelligenciában rejlő előnyöket.

Figyelemreméltó tény, hogy például a McKinsey AI-ról szóló általános jelentése is a GenAI-eszközök megnövekedett használatáról számol be a szervezeteknél (a 2023-as 55% tavaly már 71%-ot mutatott, azaz a szervezetek közül ennyi volt, amely legalább egy üzleti funkcióban AI-t vett igénybe). Az Arize cég iparági felmérése szerint hasonló folyamat játszódik le az adattudósok körében is: a kipróbálástól, kísérletezéstől haladunk a munkafolyamatokba való beépülés, a mélyebb adaptáció irányába. Az ember és AI kollaborációja tehát az adattudományban is elkezdődött.

Egy felmérés szerint az adattudósok 63%-a már rendszeresen használ LLM-eket az elemzési munkafolyamatokban, ami jól mutatja ezeknek az eszközöknek a növekvő elfogadottságát a szakmában. Emellett a visszajelzések azt mutatják, hogy az adattudósok nagy része (90%) indokoltnak tartja a generatív AI körüli felhajtást, és több mint a felük (55%) úgy véli, hogy ez jelentős hatással lesz a vállalkozásukra a következő egy-két évben.

A hogyan és mit kérdése

A legáltalánosabb, leginkább magától értetődő LLM-használat adattudósok részére:

Az LLM mint adatfeltáró: „mutasd meg, amit én nem veszek észre!" modell, ahol az adattudós irányításával az LLM alternatív mintázatokat keres az adatokban.

Az LLM mint kódíró partner: "te írd meg, én finomhangolom" modell, ahol a modell generálja az alapkódot, amit aztán az adattudós optimalizál.

Az LLM mint értelmező: "segíts kommunikálni!" modell, ahol a technikai eredményeket az LLM üzleti nyelvre ülteti át.

Az LLM-ek ráadásul integrálhatók prediktív AI-megoldásokkal, például a Pecan AI Predictive GenAI-jával, amely természetes nyelvi interfészeket és automatizált kódgenerálást kínál, javítva a felhasználói élményt és hatékonyságot. Ez lehetővé teszi, hogy az adattudósok természetes nyelven adhassanak ki parancsokat, például "Mutasd meg az ügyfélelégedettség trendjeit".

A Stanford HAI és MIT Media Lab közös kutatásai kimutatták, hogy az iteratív promptfejlesztési módszerek 46%-kal pontosabb eredményeket produkálnak, mint az egyirányú utasítások, ami alátámasztja, hogy a jó együttműködés nem monológ, hanem párbeszéd. Emellett a GitHub Copilot, egy LLM alapú kódolási asszisztens bizonyítottan javítja a fejlesztői termelékenységet, csökkenti a kódolási megoldások keresésére fordított időt és felgyorsítja a fejlesztési folyamatot.

Az ideális munkamegosztás: ki miben jó?

A hatékony együttműködés kulcsa a funkcionális munkamegosztás. Az LLM-ek kiváló képességekkel rendelkeznek olyan területeken, mint például a gyors kódgenerálás és hibajavítás, az alternatív elemzési utak szisztematikus feltárása vagy a dokumentáció generálása és a minták felismerése.

Az LLM-ek különösen hasznosak az adatelőkészítés és -tisztítás területén. A McKinsey egy 2024-es riportja szerint a generatív AI akár 80%-kal is csökkentheti az adattudósok adatelőkészítési munkáját.

Az ember eközben megtartja kulcsszerepét, hiszen ő az, aki – valóságértelmezésének köszönhetően – megérti az üzleti probléma mibenlétét, lényegét, azonosítja a kritikus döntési pontokat, validálja az eredményeket, és egyáltalán: ő a szakértő, aki a promptolási folyamat elején, közepén és végén (a kimenetnél) áll.

A leghatékonyabb adattudósok nem azok, akik a legjobban kódolnak, hanem akik a legügyesebben irányítják és értelmezik az LLM-ekkel közös munkafolyamatot. Ezt támasztja alá ugyancsak a McKinsey Global Institute friss elemzése is, amely szerint az adattudósok munkaidejének átrendeződése radikális: a kódolással töltött idő 37%-kal, az adattisztítási feladatokra fordított idő pedig 42%-kal csökkent, miközben az elemzési stratégiák kidolgozására fordított idő 64%-kal, az üzleti értelmezésre szánt idő pedig 51%-kal nőtt.

Néhány tipp a hatékony együttműködéshez

1. Tekints az LLM-re úgy, mint egy junior kollégára, aki gyors, de irányításra, gyakran korrekcióra szorul. Aki lelkes, sohasem sértődik meg, és számtalanszor felkérhető ugyanannak a feladatnak a finomítására, csiszolására.

2. Alkalmazz iteratív prompt stratégiákat! Ilyen a "chain-of-thought" módszer, ahol lépésről lépésre vezeted az LLM gondolkodását, és ez pontosabb elemzéseket eredményez. A Datacamp kutatásai szerint ez a megközelítés 28%-kal pontosabb elemzésekhez vezet.

3. Tartsd fenn a kritikus szemléletet! Minden LLM-eredmény validálást igényel.

4. Dokumentáld az együttműködést! Egy cégen belül rendkívül fontos, hogy a legjobb promptok és munkafolyamatok ne vesszenek feledésbe, hanem mások is profitálhassanak a már megszerzett tudásból. A Bloomberg jelentése szerint a pénzügyi szektorban a regulátorok már explicit módon kérik az LLM-közreműködés dokumentálását az elemzésekben.

Az augmentált adattudós kora

Az ember-LLM együttműködés nem a helyettesítés, hanem a kiegészítés, az ember képességeinek kiterjesztése felé mutat. Ebben az augmentációs folyamatban az adattudósok szerepe nem csökken, hanem átalakul: a kódolási részletekről a stratégiai irányítás és értelmezés felé mozdul, a repetatív munkától a gondolkodósabb feladatokig.

Az együttműködés trendjét erősíti meg az Arize felmérése is, amely szerint az AI-csapatok több mint fele (57,7%) tervezi egy kisméretű nyelvi modell éles környezetben történő bevezetését a következő 12 hónapban, vagy amilyen gyorsan csak lehetséges. Ez a tendencia azt mutatja, hogy az LLM-ek és a generatív AI nem csupán kísérleti projektek maradnak, hanem egyre inkább a mindennapi munkafolyamatok részévé válnak.

Ha eljön a 2025. május 20-i konferenciánkra, még több érdekes információt osztunk meg az LLM és az adattudomány kapcsolatáról.

Élelmes megoldások a mesterséges intelligencia használatára

Iparág: Biztosítás

Vajon az MI térhódításából kimaradhatnak-e a nyelvünknek oly kedves ízek, textúrák elkészítői, gyártói? Semmiképpen! Nem véletlen, hogy – természetesen a marketinglehetőséget kiszagolva, a hájp hullámára felkéredzkedve – az élelmiszeripar területén is egyre több hírt kapunk a mesterséges intelligencia használatáról.

Pokoli ötlet

Idén júliusban, az uborkaszezonnak tartott nyári időszakra alaposan rácáfolva a szikszói HELL gyár merészet húzott. A magyar energiaitalokat és üdítőket gyártó cég ugyanis bejelentette: elindult a gyárában a világ első, MI-vel gyártott energiaitalának a gyártása. A keresztségben a kissé hosszúra nyúlt Tutti-frutti & Berry-blast ízű HELL A.I. nevet kapta az új ízű almárka, melynek „minden elemét, szigorúan megválogatott összetevőit, designját és marketing eszközeit is az A.I. tervezte és meg is kóstolta.” Ez utóbbi érdekes kérdés, és egy magyar portál utána is járt ennek.

Kiderült, hogy az ezzel foglalkozó cégek az úgynevezett e-mouth („e-száj") és e-nose („e-orr") segítségével digitalizálnak. Az egyik New York-i cég például egy évtizede épít olyan adatbázist, amely követi a fogyasztók érzékszervi preferenciáját, ízlését. A rengeteg adat pedig abban segít, hogy a fogyasztók egy csoportjáról prediktíven meg lehessen mondani, hogyan fognak reagálni egy-egy új ízvilágú termékre. Ezzel ki lehet kerülni az éles ízteszteket, fel lehet gyorsítani a folyamatot – persze kérdéses, hogy az algoritmus pontosabb képet ad-e, mint az egyébként természetszerűleg kisebb mintafelvételre képes hagyományos bolti kóstoltatás.

Az MI előnyei

Az élelmiszeripar a fenti példán túl is sokat profitálhat a mesterséges intelligencia egyre intenzívebb használatából. Az egyik ilyen magától értetődő felhasználási terület az ételek szelektálása, a rossz minőségűek kiszűrése. Ehhez az ún. computer vision módszereket alkalmazzák, melyek a deep learning alapú megoldások (pl. a konvolúciós neurális hálózatok) elterjedésének köszönhetően egyre kisebb hibaaránnyal, már az emberi szemnél pontosabban dolgoznak.

A vásárlói szokások, választások feltérképezésén, „megjóslásán” túl maga az élelmiszeripari infrastruktúra is sokat nyer az MI-vel. Például a feldolgozóiparban előre megmondhatja egy-egy nagyobb értékű gép karbantartásának vagy cseréjének várható időpontját.

Ezen túlmenően pedig – ahogy már ma is látszik – a generatív mesterséges intelligencia robbanásszerű publikus megjelenése a robotikával foglalkozó szakembereknek is újabb inspirációkat, ötleteket adott. Így az élelmiszeripar robotizációja is tovább erősödhet. Ez nagy reményt ad, hiszen a fenntarthatóság az egyik legfontosabb szlogen és elvárás. Ha a mesterséges intelligencia segít az élelmiszerpazarlás vagy a jobb, de a Földdel is barátságosabb termesztési módszerek kialakításában, meghonosításában – nos, az mindannyiunk számára könnyebb évtizedeket vetít előre egy túlzsúfoltsággal küzdő bolygón. Az iparági becslések szerint erre szükség is van: meredeken emelkedik az élelmiszerek iránti kereslet, különösen az ázsiai régióban, de az USA-ban sem esznek kevesebbet, mint akár 20 éve.

MI: szinte mindenhol

A Springer német tudományos kiadó felületén megjelent egy tanulmány, amely szerint szinte minden termelési terület jól jár a mesterséges intelligenciával. Az MI megjósolta már többek közt a kakaópor várható összetételét, minőségét, az extra szűz olívaolajok minőségi besorolását, a mangó súlyát, a gombák nedvességtartalmát a szárítási periódusban, de jó becsléseket adott a világ élelmezésében kritikusnak számító rizs terméshozamára is.

Jól látható, hogy a jövő ételeinek kialakításában is egyre jobban számíthatunk az MI-re, amely ügyesen kiszagolja a trendeket is. Apropó, e-orr! A cikk elején, a HELL bejelentésével kapcsolatban megidézett eljárás fő hardvereleme néhány nem specifikus gázérzékelő, amelyek különféle, eltérő erősségű vegyi anyagokkal lépnek kölcsönhatásba. Az e-orr fő szoftverkomponensei egyrészt a mintavételezést végzik, mely során az élelmiszer jellemzőinek feltérképezése zajlik, másrészt a mintafelismerő algoritmusok pedig ezeket az információkat feldolgozzák és a fontos részleteket azonosítják, majd ezek alapján történik a kiválasztás.

Borok, gabonafélék, étolajok, tojás, tejtermékek, hús, haltermékek, frissen vágott és feldolgozott zöldségek, tea, kávé és gyümölcslevek esetében sikeresen alkalmazták már az e-orr mintavételi osztályozást, kimutatást és minőségellenőrzést – van (MI-) élet tehát az energiaitalokon túl is.

Ha pedig kicsiben mi is szeretnénk kísérletezni, találjunk ki furcsa, még nem létező ételeket a ChatGPT segítségével, és rajzoltassuk meg a Midjourney vagy a Dall-E 3 segítségével. Jó étvágyat!

Élet az OpenAI-n kívül

Iparág: Biztosítás

Világszerte ömlik a pénz a generatív mesterséges intelligenciát kínáló, fejlesztő vállalkozásokba. Természetesen a ChatGPT forradalma tette lehetővé, hogy csak idén, alig háromnegyed év alatt új unikornisokat üdvözölhessünk a színtéren. Ezek az egymilliárd dollárnyi céges értéket elérő vállalatok és vállalkozások megmutatják, hogy bár az OpenAI még mindig a legfontosabb szereplő, a generatív MI-ben már sorakoznak a tőkével jól ellátott trónkövetelők. Cikkünkben a teljesség igénye nélkül mutatunk be párat ezek közül.

Born In The USA

Az első és legfontosabb megállapítás, hogy a legtöbb, igazi potenciállal rendelkező, generatív mesterséges intelligencián dolgozó cég az Egyesült Államokban található. Vannak ugyan nem amerikaiak is (ezekből is szemezgetünk ebben az írásban), de a befektetői pénz alapvetően az USA-n belül áramlik.

Érdekes, hogy Kína válasza a ChatGPT-re a 2023 márciusában bemutatott Ernie (Enhanced Representation through Knowledge Integration) bot,a Baidu óriásvállalat által elkészített chatbot – nyugati társaihoz hasonlóan – beépített „cenzúrával” rendelkezik. Amíg az USA-ban ez az identitás, politika és kisebbségi kérdések körül forog, addig Kínában pártpolitikailag korrekt, nem lehet megkérdezni Ernie-t például a kínai elnökről vagy az 1989-es Tienanmen téri vérengzésről. Októberben jelentették be az Ernie 4.0-t, amelyet a ChatGPT-4 riválisának szánnak: ezt egy élőben írt harcművészeti regény, valamint reklámposzterek létrehozásával demonstrálták. A verseny erősödését jól jelzi a tény, hogy Kínából származik a nagy nyelvi modellek 40%-a, és ez alig marad el az USA 50%-ától.

Az országokat tekintve kétszereplős modellbe beleszólást kér a sok szempontból már régóta a jövő felé kacsingató Egyesült Arab Emirátus. Az öbölmenti olajhatalom ugyanis 2023-ban mutatta be a Falcon 40B-t, amelyet az egyik legerősebb nyílt nagy nyelvi rendszernek tartottak a szakértők, szeptemberben pedig az elképesztő gyorsaságúnak titulált újabb modellt, a 3,5 trillió (!) tokenen betanított Falcon 180B-t. A királyság azt reméli, hogy dedikált figyelme és erőforrásai miatt a Falcon 180B a régióban elterjed, és meghatározó szerepe lesz majd az orvoslásban vagy a biotechnológiában éppúgy, mint például a pénzügyek területén.

Nagyban játszanak

A ChatGPT egyik nehézsúlyú konkurense az Anthropic cég. Létrejötte úgyszólván belsős munka, hiszen az OpenAI néhány korábbi, magas beosztású munkatársai, többek közt a kutatási igazgató alapította. Legfontosabb produktumuk a Claude nevű chatbot, amelynek idén novemberben bemutatott 2.1-es változata már bemenetként akár egy 500 oldalas angol nyelvű könyvet is képes kezelni, vagyis a kontextusablaka minden eddiginél – és riválisainál is – nagyobbra nyílt. A ChatGPT jobb az általános, nyitott végű csevegésekben, míg a szakértők a Claude precízebb technikai válaszait dicsérik, és kiemelik a hosszú formátumú elemzésekben való ügyességét.

A San Franciscó-i Anthropic fő befektetői közé tartozik az Amazon és a Google is.

Hollywood végveszélyben?

A text-to-video terület egyik nagyágyúja a New York-i Runway. Nem is mérete, hanem szolgáltatása miatt számít annak: a szöveg alapján filmet generáló terméke ugyanis az egyik legelképesztőbb minőséget produkálja. A TIME magazin az év 100 legbefolyásosabb vállalata közé választotta a művészek által alapított céget, amely forradalmasítani, vagyis demokratizálni, olcsóbá és elérhetőbbé kívánja tenni a filmkészítést. Többféle kreatív eszközt gyárt, amelyek könnyebbé teszik akár a vágást és a változtatásokat is.

A nemrég meghirdetett saját filmes pályázata, a beküldött munkák minősége bebizonyította, hogy felmérhetetlen potenciál rejlik ebben a területben, vagyis tulajdonképpen a Runway munkájában.

Szövegben erős

Az izraeli, az idén unikornissá változott cégek listáján előkelő helyen szereplő AI21 nem most kezdte az ipart: már 2017-ben kijöttek az írást segítő asszisztensükkel, a Wordtune-nal. A tel-avivi székhelyű vállalat azóta új termékekkel rukkolt elő, például a Wordtune Spice-szal, amely azt ígéri, hogy automatikus szövegkiegészítése segítségével gyorsabbá teszi magát az írást is. Sokan a ChatGPT riválisát látják e termékük tudásában. Így nem csoda, hogy a befektetők közt olyan neveket találunk, mint az Nvidia vagy a Google.

A kód neve: Replit

A 2016-ban alapított, San Francisco székhelyű Replit a programozók aranybányája – legalábbis mesterséges intelligencia szempontból. Az OpenAI API-ját használó szoftver ugyanis MI alapú eszközökkel segíti a kódgenerálást, a programozást. A Replit képes automatikusan kódot létrehozni a felhasználó által, természetes nyelven bevitt prompt alapján, illetve képes felismerni a hibákat és azokat kijavítani. Nem utolsósorban lehetőség van a kódok stílusának formázására is. A böngészőből irányítható, online integrált fejlesztői környezet nagy népszerűségre tett szert a programozók közt, ezt bizonyítja a rengeteg példa, amellyel ezzel kapcsolatban a közösségi médiában (főleg az egykori Twitteren) találkozhatunk.

Az Ön élethű avatárja

Rövid felsorolásunk nem lehet teljes a már egy ideje meglévő, és egyre gyakrabban használt Synthesia nélkül. A 2017-ben alakult brit cég mélytanulási modellre alapozott terméke úgy dolgozik, hogy mintát vesz a felhasználó videójából, a kép és a hang feldolgozása után lehetőséget adva, hogy bármilyen beírt szöveget az avatár elmondja. Prezentációkhoz, tanfolyamokhoz, e-learning anyagokhoz így jól használható ez a megoldás, ráadásul már 60 nyelven. Így például egy magyarul felvett anyagból például angolul is beszélő avatár készíthető.

Visszavág-e a birodalom?

A terület újdonságait követők számára legfontosabb kérdést, hogy mit lép – elsősorban az OpenAI diadalmenetére – a nagy testvér, az Alphabet (Google).

Először a Bard chatbotjuk relatív sikertelensége (tapasztalatok alapján: relatív elmaradottsága) mutatta meg, hogy Alphabet programozói és szakemberei még nem tudták utolérni a ChatGPT-4-et. A titokzatos Gemini-projektnek, amely az új generatív mesterséges intelligenciának szánnak, először eltolták az idénre várt hivatalos bemutatását, majd decemberben mégis bemutatták a Gemini 1.0-át. (A kedélyeket borzolta egy korábbi demóvideó, amely hihetetlen képességeket mutatott a Geminiről, de kiderült, hogy egy erősen megszerkesztett vágatról van szó.)

Mindenesetre a Gemini multimodális, vagyis bemenetként (prompként) képet, szöveget, hangot és videót is elfogad – igaz, a hang- és képelemzési képességeit már csak jövő évre ígérik. A három különböző csomagban és tudással (Ultra, Pro és Nano) kínált nagy nyelvi rendszer igyekszik a rivális hajójából kifogni a szelet. Az előjelek kedvezőnek tűnnek a régi-új trónkövetelő számára: a Google állítja, hogy a benchmark tesztekben produktumuk már most veri a ChatGPT-4-et.

A Bardba beépülő rendszer a Google saját mobiltelefonjába is bekerül, és már az API-jához is hozzáférnek a fejlesztők, újabb frontot nyitva a legfrissebb platformháborúban.

Értjük egymást?

Iparág: Biztosítás

Az európai kultúrában kitüntetett szerep jutott a bibliai Bábel történetének. Eszerint maga Isten zavarta össze a nyelveket, hogy az emberek ne értsék meg egymást, és ezzel gonosz szándékú együttműködésük meghiúsuljon. Napjainkban, különösen a mélytanulási technikák, a jobb algoritmusok, a még több adat korában a bábeli átok megszűnése felé tartunk. Az ember közbeiktatása nélküli, bármilyen nyelvről bármilyen nyelvre történő azonnali fordítás ma már kézzelfogható közelségbe került. Különösen két cégre érdemes odafigyelnünk, ha a gépi fordítás jelenlegi helyzetére vagyunk kíváncsiak.

Úton az 1000. felé

A Google Fordító mind a mai napig talán a legismertebb, ingyenességének és a böngészőbe való beépülésének köszönhetően pedig a legelterjedtebb gépi fordítási szolgáltatás. Éppen emiatt is elképesztő bejelentést tettek 2024 júniusában: újabb 110 nyelvvel bővítették a fordítójuk tudását, amellyel 600 millió, kevésbé használt nyelvet beszélő fedezheti fel a Fordítót (például olyan igazán egzotikus nyelvpárokon, mint a latin-kikongo). A Google célja továbbra is ambiciózus: az 1000 legbeszéltebb nyelvet kívánja elérhetővé tenni a Fordítóban.

Statisztikai megközelítésről a mélytanulásig

A 2006 áprilisa óta ingyenesen használható Google Translate eredetileg a statisztikai gépi fordítást alkalmazott, és a következőképp működött: a kívánt szöveget először angolra, mint közvetítő nyelvre, majd a célnyelvre fordította. A fejlesztéshez szükséges nyelvi forrásokat az ENSZ és az Európai Parlament többnyelvű hivatalos dokumentumai adták.. Az eredeti fordítások elkerülhetetlenül tökéletlenek voltak, de annak a célnak megfeleltek, hogy feltárják az eredeti szöveg általános szándékát, még akkor is, ha a Google Fordító nem tudott olyan hibátlan, gördülékeny fordítást készíteni, mint amit egy emberi szakértőtől elvárnánk. 2016 novemberében a Google bejelentette, hogy áttért a neurális gépi fordításra NMT), , amelynek során a szolgáltatás már nem csak szövegrészeket, hanem egyszerre egész mondatokat fordított.

Mit tud az NMT?

Az NMT modell alapja az encoder-decoder architektúra. Az encoder fázisban a forrásszöveg egy vektortérbe kerül átkódolásra, ami numerikus reprezentációként a szöveg összes jellemzőjét tartalmazza. Ezt követően a decoder fázisban a rendszer ezt a numerikus vektort visszaalakítja a célnyelvi szöveggé. Ez az architektúra lehetővé teszi, hogy a rendszer jobban megértse és kezelje a hosszabb, bonyolultabb mondatokat is.

Ez nagyobb pontosságot biztosított, hiszen a teljes kontextust adta meg, nem pedig csak az elszigetelt mondatrészeket. Másik jó példája a fejlődésének, hogy a japán-angol fordítások koreai-angol fordításokkal való összehasonlítása révén a szolgáltatás képes levezetni és feltérképezni a japán és a koreai nyelv közötti kapcsolatot, és ennek megfelelően fordításokat készíteni oda-visszaF, ami nagy előrelépés a számítógépek szemantikai megértésében egy olyan folyamatban, amelyet még mindig megzavarnak a metaforikus kifejezések és a furcsa idiómák. Ezeknek a számításoknak az újra és újra történő feldolgozása lehetővé teszi a Google számára, hogy felismerje a különböző nyelvek szavai között ismétlődő mintákat, és ezzel a pontosság elérésének esélye folyamatosan javul.

Attention is All You Need

A Google Fordító NMT rendszere emellett használja az "attention" mechanizmust, amelyet eredetileg a Google kutatói fejlesztettek ki. Az attention mechanizmus lehetővé teszi, hogy a modell fordításkor figyelemmel kísérje a beviteli szöveg különböző részeit, így biztosítva, hogy a fordítás pontosabb és kontextusérzékenyebb legyen. Ezt azzal éri el, hogy a releváns információkra összpontosít, a modell pedig szelektíven kezeli a bemeneti adatok különböző részeit, és különböző fokú fontosságot vagy súlyt rendel a különböző elemekhez.

Ennél is nagyobb lépésnek számított a ma már informatikatörténeti jelentőségű, 2017-es kutatási dokumentum, a Beatles híres dalának címére utaló Attention is All You Need. Az ebben felvázolt Transformer architektúra a szöveg minden részére egy időben fókuszál. Ez növeli a fordítás pontosságát és jelentősen javítja a hosszabb szövegek kezelését.

De minden elméleti megalapozottsága ellenére nem a Google, hanem egy kisebb német cég fordítója viszi el a pálmát (egyelőre).

Aprólékosabb megközelítés

A DeepL egy kölni startup, amely mind a benchmarkokban, mind a visszajelzésekben mérhető elsöprő sikerét több tényezőnek köszönheti.

Az eredetileg a Linguee fordítóeszköz spin-offjának induló vállalkozás a Google-höz hasonlóan neurális gépi fordítást alkalmaz, és használja a Transofrmer modellt is – a hasonlóság azonban itt véget ér az amerikai techóriással. A DeepL ugyanis alkalmazza a megerősítő tanulást (reinforcement learning), amely lehetővé teszi a modell számára, hogy saját hibáiból tanulva folyamatosan fejlődjön. A rendszer a felhasználói visszajelzések és az új adatok alapján képes jobban összpontosítani a tipikus fordítási hibák kiküszöbölésére. A kölniek ráadásul saját nagy teljesítményű adatközpontokat üzemeltetnek, amelyek kifejezetten a neurális hálózatok futtatására vannak optimalizálva. Így a DeepL rendszere hatékonyabb és gyorsabb, a felhasználók számára a lehető legjobb élményt biztosítva.

Mindez azt eredményezi, hogy – különösen az európai nyelveket tekintve – a DeepL képes a legjobb fordításokra. Mivel a megerősítő tanulással sok visszajelzést kap, sokkal hatékonyabb a szövegkontextus megértésében is.

Természetesen a többi infotechnológiában utazó cég is folyamatosan fejleszti fordítási eszközeit. Ilyen például a Microsoft Translator, az Amazon Translate vagy az IBM Watson is. A jövő emellett minden bizonnyal a multimodális megközelítésé, vagyis a szövegből, képből, élő felvételből képzett fordításoké.

Ebben az a jó hír, hogy a magyar nyelv elszigeteltsége is véget érhet.

Gépi logika vs. emberi döntés

Iparág: Biztosítás

Kedves Olvasók! Jó reggelt, híreket mondunk:

Az USA becslések szerint közel évi 10 milliárd dollárt költ különböző mesterséges intelligenciatechnológiákkal kapcsolatos kutatásokra, az EU költése nem éri el ennek az ötödét.
Kína megelőzte a mélytanulás témájú publikációk számában az USA-t.
Az IBM rendszere az adatok értelmezése után a rákkezelés mikéntjére tesz ajánlatot, többen azzal támadják a rendszert, hogy még kiforratlan.
Az Amazon nemrégiben jelentette be automatikus boltját: ott a gépek döntik el, hogy tolvajok vagyunk-e vagy sem?
Súlyos baleset történt a Tesla/Uber/Google/… önvezető autójával.
Brüsszelben, az Európai Parlamentben robotok jogi személyiségével kapcsolatos szabályozást terveznek.

A felsorolt hírek sokféle érzést váltanak ki a különböző hallgatókból. A legtöbb embert lenyűgözi vagy megijeszti, hogy a gépi automaták mindennap újabb területen múlják felül az embert. Aki régóta foglalkozik az MI valamelyik részterületével, az valószínűleg leginkább bosszús lesz. Laikus, vagy éppen manipulatív hírszerkesztés, blődli, pontatlan fogalmazás. Bár az utolsó hír tulajdonképpen megmosolyogtató…
Ha az olvasónak is furcsa, hogy az EU-bürokraták is robotjogokat fogalmazgatnak, akkor joggal gyanakodott, ma még nincs olyan gép, és a közeli jövőben nem is lesz, amely képes lenne erre. Nincs egyébként valódi társalkodó robot sem, vagy munkáját magára hagyva végző recepciós robot, bár a teljesen autonóm, önvezető járművek bevezetéséhez közel kerültünk. A következő években, évtizedekben a mai folyamatokat jelentős mértékben gépi automatizmusok fogják kiváltani, és az emberi döntések helyét egyre nagyobb mértékben gépi döntések fogják átvenni. Valójában ez a folyamat már régóta zajlik, és számos döntést már ma is gépek hoznak.

Gépi döntések – gépi hibák

2010. május 6-án, a New York-i tőzsdén egy hirtelen esés következett be, amit úgy is ismernek, hogy 2.45-ös villámkrach, mindössze néhány percig tartott, és közben a tőzsdemutató 9 %-ot zuhant, majd szinte azonnal vissza is ugrott. Bár az okokat természetesen vizsgálták, de nem tisztázta azokat teljesen a SEC vizsgálata sem, így sokan az algokat gyanítják a háttérben. Az algo olyan algoritmus, amely gyors egymás utáni (magas frekvenciájú) kereskedésre alkalmas. Egyes tőzsdei kereskedési típusokban ma már meghatározó ezeknek a HFT-eszközöknek a használata. Annyira meghatározó, hogy ma már nem lehet elképzelni nélkülük a tőzsde működését. Ilyenkor néhány perc alatt hatalmas portfóliók rendeződnek át, egyesek sokat nyernek, mások vesztenek. Ki a felelős a tőzsde ilyen zuhanásáért? Ha valóban az algok, akkor az a felelős, aki programozta őket? Vagy az, aki üzemelteti? Vagy az, aki a piac működését szabályozza? Botrány alakul ki, amikor egy gép olyan döntést hoz, amely mögött valami hátsó szándékot, rejtett szándékot, előítéletet sejtünk. Ráadásul joggal sejtünk „előítéletet”, hiszen a gép valamilyen nagy mintán, statisztikai alapon hozza az ítéletet. Ilyen, amikor egy gépjármű-biztosítási modellben felbukkannak az adott ügyfél nemével, korával, vagy szociokulturális jellemzőivel kapcsolatos adatai. Vagy ilyen, amikor egy komment robot vagy a Facebook automatája olyan döntést hoz, amely előítéletesnek tűnik. Sajnos ma nagyon jellemző az a képmutató magatartás, ami a gépet hibáztatja ezekért a döntésekért, pedig a gép csak megoldotta azt a feladatot, amit adtunk neki. Az adatjogi problémák miatt mostanában komolyan megcibált Facebook az álhírgyártókkal, a félrevezető reklámokkal és a trollokkal is komolyan küzd. Ők például sikertelenül próbáltak gépi algoritmusokat használni moderálásra, ezért visszatértek az emberi cenzorokhoz, akiknek 1000 posztot kell minősíteni óránként. Az három és fél másodperc döntésenként. Biztos, hogy ezalatt jobb döntést hozunk, mint egy gép? Vagy inkább arról van szó, hogy a Facebook nem akar egy újabb konfliktust felvállalni? Várhatóan számos területen a robotok jobbak, gyorsabbak, pontosabbak lesznek, mint az ember, de nem lesznek tökéletesek, ezért senki nem akarja vállalni a ritka, de kiszámíthatatlan hibáikat.

A gépi döntések háttere

Hogyan döntenek a gépek? Hiszen minden útkereszteződésben vagy orvosi leletek kiértékelésekor is gyakorlatilag döntéseket hoznak. Gyanús eseteket vizsgálnak, és riasztanak a rendőrségen, vagy a pénzintézetekben. Mivel egyre többször hagyatkozunk rájuk, érdemes jobban értenünk a gépi döntések logikáját, hátterét. A köztudatban a gépi döntés egyfajta mechanikus ismétlődéses folyamat: a gépek ugyanabban a helyzetben ugyanolyan feltételek mentén mechanikusan ugyanazokat a „gépies” döntéseket hozzák. Valójában ez már régóta nincs így, aki egy kicsit is ismeri a gépi tanulás fogalmát, az pontosan tudja, hogy ezek az algoritmusok képesek a tapasztalati adatokra épülő tanulásra. Nincs is ebben semmi újdonság, most mégis hirtelen minden második cikk a robotokról szól. Mi változott? A számos ok felsorolása meghaladja a cikk kereteit, de a legnagyobb horderejűt kiemelnénk. Körülbelül 2012-től elméletben már régóta ismert, nagy számításigényű algoritmusok nyertek teret, mert elérhetővé váltak a hozzájuk szükséges kapacitású hardverek (GPU-k) és open source szoftver könyvtárak (pl. Tensorflow, Theano). Az új algoritmusok, amelyeket összefoglaló néven mélytanulásos, vagy mélyneurális hálós technológiáknak hívunk, szinte felboncolhatatlanul bonyolult struktúrákat tartalmaznak, hiszen a neurális háló topológiája és megannyi tulajdonsága is alkalmazkodik magukhoz a tanulóadatokhoz, és ezért olyan nagyon bonyolult az értelmezésük. Legtöbbször ezt igazából meg sem szoktuk próbálni, hanem csak fogjuk, és fekete dobozként használjuk a modellt. Szerencsére a gép is egyre nagyobb, és komplexebb feladatokat old meg magától, egyre inkább rutinszerűen, és minket is kevésbé érdekel a belseje, ha a feladatot kellően jól végzi. A legfontosabb, hogy valamilyen metodikát vagy mérőszámot alakítsunk ki ahhoz, hogy mérjük a gép teljesítményét, illetve ahhoz, hogy mérjük, hogy képes-e tanulni azok alapján a hibák alapján, amiket éppen elkövet. A szakértők számára természetes, hogy a tapasztalati adatokból tanuló gépek is hibáznak. A gond abból fakad, hogy egyre több laikus ember is használja ezeket az eszközöket, és számukra megdöbbentő módon a gépek egyre autonómabb módon tudnak viselkedni és komplexebb döntéseket tudnak hozni. Erre emberként kétféleképpen reagálhatunk rosszul: vagy túlságosan rábízzuk magunkat az imponálóan magabiztos gépekre, vagy az első pillanattól gyanakszunk, és a gép első hibája után megerősítve látjuk az előítéletünket. Talán az a baj, hogy egy nehéz döntés előtt nem látjuk emberi módra hezitálni a gépet? Lehet, hogy a jövőben az UX-tervezőknek majd erre is figyelniük kell a robotok tervezésekor.

Konklúzió

Ijesztő, hogy mennyire automatikusan várunk el a gépi logikától emberi döntéseket. Amelyek nem univerzálisan, hanem csak emberi lényként racionálisak. Az ember társas lény, a gondolkodásunk rengeteg szociális elemet tartalmaz. Minden cselekedetünk más emberek közegében, a társadalmi térben zajlik. Ezért azt várjuk az algoritmustól, hogy amikor „okos” döntést hoz, akkor automatikusan figyelembe vegyen formális logikával nehezen magyarázható szociális megfontolásokat. A gépi intelligencia tehát sok esetben pontosabban és gyorsabban dönt. Különösen akkor, ha sok, és összetett, de a gép számára mégis jobban értelmezhető információt kell feldolgozni. És ha emellett milliónyi korábbi tapasztalati adat, megtörtént esemény kimenetelével kell összevetni az eshetőségeket. Ilyen esetben a gép felülteljesíti az embert. Tehát adjuk neki át a kormányrudat? A döntés a jövőt befolyásoló cselekedet. A döntési folyamat csak egyetlen aspektusa a mérlegelés. Ebben a fázisban számos esetben jobb a gép. Azonban a felelősség fogalma ismeretlen a számára, és hosszú ideig még biztosan az lesz. Felelősséget vállalni csak az ember képes, ezért nem próbálkozhatunk annak átruházásával. Ahol a döntésnek súlya van, ott ugyan támogathat bennünket a gép, de végül az ember nem ússza meg, fognia kell a kormányt. Más esetben, ha jobban teljesítenek, akkor jöjjenek a gépek!

JÖNNEK? JÖNNEK!!! Na, de tényleg, mikor JÖNNEK?

A saját agyunk is számos megismerési hibával, torzulással csap be bennünket. Ezek közé tartozik, hogy egy komplex problémát túl egyszerűnek, vagy túl bonyolultnak látunk. Manapság sokan robotokat látnak mindenhova, és már a saját jövőjüket tervezik, amikor a robotok már elveszik a munkájukat. Ugyanakkor kezd megjelenni a szkeptikus hangok hasonlóan értelmetlen hulláma: nem lesz ebből semmi, nem teljesülnek az ígéretek! Egyet ígérhetek: a jóslatok túlnyomó többsége megbukik. Különböző becslések 15-30 évet adnak arra, hogy a mélyneurális hálók mérete elérheti az emberi agyét. Feltéve persze hogy a fejlődés a jelenlegi ütemű marad. Egyáltalán nem tudjuk azonban, hogy mekkora méretű, sebességű, és energia fogyasztású modelleket sikerül kreálni, én arra tippelek, hogy ezek a paraméterek még hosszú ideig lényegesen rosszabbak lesznek az emberénél. Valószínűleg az evolúciónak sem véletlenül telt ez ötszázmillió évébe. Ezt a cikket egy pajkos kölyökkutya lelkes asszisztálásával írom, erős a gyanúm, hogy a jövő gépi nebulói sem tanulnak majd karakterisztikusan gyorsabban az embernél, vagy ennél a blökinél, szájában a papucsommal. Az ember által végzett feladatok túlnyomó része azonban nem igényel emberi szintű intelligenciát. Egy agysebész robotnak nem kell agysebésznek lennie, a műtétet mégis emberfeletti precizitással fogja végezni. A robotok eljövetelének sebességét tehát leginkább a gazdasági racionalitás és a szervezetek adaptációs képességének az egyensúlya fogja meghatározni, és erős a gyanúm, hogy ebből a kettősből a saját képességeink meghatározta második lesz a domináns.

*Körmendi György és Naruto, a fekete makákó önarcképe a Google Deepdream neurális hálójával Van Gogh stílusában módosítva készültek.
Kép: Naruto, David Slater, Google, Vincent Van Gogh, és a cikk szerzője

Gondolatolvasó mesterséges intelligencia?

Bevezető szöveg: Egy apró, de jelentős lépéssel közelebb kerültünk a korábban sci-fi filmekből ismert jelenséghez: amerikai tudósok olyan mesterséges intelligenciát fejlesztettek ki, amely képes az agyi aktivitásokat szöveggé alakítani.
Iparág: Biztosítás

A rendszer jelenleg a neurális mintázatok alapján csak akkor működőképes, ha a vizsgált személy valójában beszél – tehát hangosan ki is mondja a mondatokat. A szakértők azonban úgy vélik, a jövőben ez a technológia segítségére lehet a beszélni és gépelni képtelen – mint például a bezártság-szindrómában szenvedő - emberek számára.

“Ugyan még nem tartunk ott, de úgy gondoljuk, ez a rendszer lehet majd a beszédprotézis alapja” – vélekedik Dr. Joseph Makin, a Kaliforniai Egyetemen készült kutatás társszerzője.

A Nature Neuroscience folyóiratban Dr. Makin és kollégái bemutatták, hogyan fejlesztették ki a rendszert: elsőként 4 olyan személy vett részt a kutatásban, akiknek epilepsziás rohamaik monitorozására elektródákat ültettek az agyába.

A résztvevőket arra kérték, hogy hangosan olvassanak fel 50 előre meghatározott mondatot több alkalommal is. A mondatok között olyanok szerepeltek, mint a „Tina Turner egy popénekes” vagy az „Azok a tolvajok elloptak 30 ékszert” – a kutatócsoport tagjai pedig beszéd közben monitorozták az alanyok agyi aktivitásait.

A begyűjtött adatokon egy gépi tanulási algoritmust tanítottak, amely az aktivitásokat számsorokká alakította minden egyes mondatnál. Ezt követően a számsorokat a rendszer második részébe táplálták, amely szóláncokká alakította az adatokat.

A rendszer elsőre teljesen értelmetlen mondatokat adott vissza – azonban ahogy összehasonlította az általa felismert szóláncokat a ténylegesen felolvasott mondatokkal, fejlődni kezdett. Megtanulta azt is, hogyan viszonyulnak a számsorok a szavakhoz, és mely szavak követik egymást nagyobb valószínűséggel.

A csoport tesztelte a rendszert, amely immár képes volt szöveget létrehozni a megfigyelt agyi aktivitás alapján. Az eredmény közel sem volt tökéletes – rengeteg mondat helyett teljesen abszurd, már-már vicces verziókat fordított.

Mindezek ellenére a rendszer jóval pontosabban dolgozik, mint a korábbi megközelítések. Míg a pontossága alanyról alanyra változó volt, akadt köztük olyan is, akinél minden egyes mondat mindössze 3%-ánál volt szükség korrekcióra - ez az arány a professzionális (emberi) fordítóknál is 5% körül mozog.

A kutatócsoport nem győzi azonban hangsúlyozni, hogy - az emberekkel ellentétben - a rendszer csak kis elemszámú mondatkészlettel képes dolgozni, hiszen nagyrészt a meghatározott mondatok kombinációjának és az angol nyelv általános mintáinak felismerésén alapul.

Azt is megállapították, hogy az algoritmus egy alany adataival való betanításának köszönhetően kevesebb adatra van szükség a végfelhasználók részéről – ezzel jelentősen megkönnyítve a betanítási folyamatot a jövőbeli páciensek számára.

Dr. Christian Herff, a Maastrichti Egyetemről ugyan nem vett részt a kutatásban, de a terület szakértőjeként izgatottan tekint az eredményekre. Azért tartja ígéretesnek a rendszert, mivel az kevesebb, mint 40 percnyi betanítási adatot igényel résztvevőnként egy meghatározott mondatkészletre – a korábbi megközelítésekkel pedig tipikusan órák millióira volna szükség.

Rávilágít viszont arra a tényre is, hogy a rendszer egyelőre nem alkalmas a súlyos állapotban lévő páciensek számára, hiszen olyan agyi aktivitásokra támaszkodik, amelyek a mondatok hangos felolvasásával rögzíthetők.

A professzor szerint a közeljövőben nem kell amiatt aggódnunk, hogy bárki képes lenne olvasni a gondolatainkban – hiszen elektródák beültetésére van szükség, valamint az elképzelt beszéd és a „belső hangunk” teljesen más agyi aktivitásokkal jár.

Egyes szakértők felhívják a figyelmünket arra is, hogy a kutatás és a rendszer etikai kérdéseket is felvet. Ugyan nagyon, nagyon messze járunk még attól, hogy a számítógépek olvassanak a gondolatainkban - ez azonban nem azt jelenti, hogy nem is kell rá felkészülnünk.

A cikk eredetileg a www.theguardian.com-on jelent meg.

Grok: Musk mesterterve a generatív MI-re

Iparág: Biztosítás

Amikor azt hittük, hogy a fontosabb szereplők már a színpadon vannak, akkor az excentrikus üzletember, Elon Musk megint nagyot húzott. A PayPallal, a SpaceX-szel és a Teslával már (technika)történetet író vállalkozó nem hagyja, hogy minden csak a ChatGPT-ről vagy a Midjourney-ről szóljon. Nyaktörő iramban fejlesztett generatív mesterséges intelligencia chatbotja, a Grok alig egy év alatt óriásit fejlődött, és a jelek szerint még fényesebb karrier áll előtte.

Musk és Altman egy csapatban: a múlt

Természetesen, aki Mars-utazást, önjáró robottaxikat vizionál, annak holmi MI-ben gondolkodni már meg sem kottyan. Elon Musk éppen ezért a több szempontból piacvezető generatív MI-fejlesztőnek számító OpenAI egyik alapítója, ott bábáskodott az MI-forradalmat elindító cég születésénél. Igaz, mindössze három évig ült a ChatGPT-t kiadó startup főemberei között, hiszen 2018-ban egyet nem értése jeleként elhagyta a fedélzetet.

Így az OpenAI az azóta belső puccsot is sikeresen túlélő Sam Altman kezébe került. A területen történő események sebességét jelzi, hogy Musk néhány hónappal a ChatGPT debütálása után már új céget alapított, a névadási mániáját – legyen benne X, mint a Twitter új nevében! – is kiélve: az xAI-t.

Kamala és Donald szerelmi élete: a jelen

Ugyancsak 2023 novemberében a bétatesztelők és az X néhány prémium előfizetője már kipróbálhatta a Grokot. Apropó, a név: Musk a Grok szót a sci-fi irodalom (itthon talán kevésbé ismert) legendás regényéből, a Robert A. Heinlein által írt Stranger in a Strange Land című kötetéből kölcsönözte. A Marson, marsiak által felnevelt fiú történetében szerepel ugyanis a grok kifejezés, amely egyfajta megértést, átélést, azonosulást jelent, méghozzá olyan intenzitással, amelyre nincs is földi szó.

A Grok betanítását még publikus, interneten fellelhető, míg a Grok-2 esetében már természetesen az X-en keletkező adatokkal végezték. (Ahogy egy korábbi cikkünkben bemutattuk, a tréningre fogható minőségi adatokból hamarosan kifogyunk – ezért utólag is jó lépésnek tűnik a Twitter megvásárlása.) Ennek során az xAI nem várt nehézségbe ütközött: az európai GDPR szabályozás miatt a cég nem taníthatja az európai ügyfelek adatain a Grok verzióit a felhasználók tudta és beleegyezése nélkül. Mivel ez utóbbi a generatív modellek általános gyakorlata, Muskéknak be kell fejezniük ezt, különben a globális éves forgalom 4%-ára rugó büntetést kapnak. A helyzet fonákja, hogy a jogsértés elkerülhető, ha az xAI vállalja, hogy ezután nem használja az európaiak által posztokban, kommentekben létrehozott információt. Igen ám, de a Grok attól még okos marad, hogy a „tananyagot” elveszik tőle - vagyis az eddigi megokosítását már nem befolyásolja ez a tiltás.

Idén augusztusban jelent meg a Grok-2, amely a Midjourney egyik kihívójának számító FLUX nevű képgeneráló modellt használja. A történet itt válik igazán pikánssá. Először is, Musk, aki ideológiailag a teljes, legszélsőségesebb véleményeket is megillető szólásszabadság híve, kiterjesztette ezt a világnézetét a Grok-2 képeire is. Ezért augusztusban az X-et elöntötték a hírességekről készült generált képek, különösen nagyot ment a két amerikai elnökjelölt szerelmi életét „feldolgozó” élethű sorozat. Nem véletlen, hogy több országban is eljárás készül vagy már indult a némely politikus által dezinformációs eszköznek tekintett X ellen, Brazíliából ki is tiltották.

Ráadásul a chatbot kétféle módon válaszol: egyrészt általános hangnemben másrészt csipkelődő-gunyoros stílusban. Ezzel az xAI nemcsak alapból megkülönbözteti a Grokot a konkurenciától, hanem alapból kétféle személyiséggel is felruházza termékét. Ezt a kis játékot amúgy nagyon szeretik a felhasználók, ahogy az az X-en közzétett bejegyzések tömegéből kiderül.

Ha ez nem lenne elég ok Grok-2-re váltani, a chatbot képes az X-en meglévő trendeket nemcsak azonosítani, hanem abból korrekt szöveges összefoglalót is írni.

Musk szándékai szerint a Grokot nyílt hozzáférésűvé szeretné tenni, hasonlóan a Meta LLama-jához.

Jön a szuperszámítógép: a jövő

Magyarországon az X Premium előfizetői jelenleg 2 850 forintért élvezhetik a Grok képességeit, amelyek meglehetősen gyorsan fejlődnek. A legújabb, 2024 augusztusi Grok-2 mini például a matematikai és vizuális képességek benchmarkján, a MathVistán, már az első háromba bekerült szeptemberben.

De az igazi nagyágyút az xAI még csak most „töltögeti”.

Elon Musk szeptember első hetében jelentette be a világ legerősebb MI-t betanító hardverének a megépítését, pontosabban a tényt, hogy ezzel is készen vannak. A mintegy 100 000 darab H100-as Nvidia-chipből álló klaszter teljesítményét ráadásul néhány hónapon belül megduplázzák. A költségek már most is csillagászatiak – iparági szakértők 3-4 milliárd dollárra teszik csak a szerverek árát – de az jól látható, hogy a generatív MI buborékja biztos nem az xAI-nál fog kipukkadni.

Kíváncsiak vagyunk, mit fog tudni a Grok-3.

Hogyan él a tudomány az MI vívmányaival?

Iparág: Biztosítás

A cím magától értetődőnek tűnik. Ugyan melyik más terület használná nagyobb természetességgel a mesterséges intelligenciát, mint a megfigyelésre, adatgyűjtésre és hipotézis felállítására épülő nyugati típusú tudomány? Ahogy azonban a példákat megvizsgáljuk, minden eddiginél jobban fogjuk látni a mesterséges intelligencia transzformatív, néha ellentmondásoktól sem mentes erejét. Figyelem, még az út elején járunk!

A biológia, mint adattenger

Ahogyan szinte minden területen, itt is ketté kell bontanunk a történéseket. A ChatGPT berobbanása előtti időkben a közvéleményt nem érdekelte annyira az MI hatása, pedig a háttérben sok cég már erre építette üzleti modelljét. Íme, egy aktuális példa!

A pandémia kellett ahhoz, hogy a világ megismerje a Massachusetts-i Cambridge-ben található Moderna gyógyszercég nevét. A 2020-as év legfontosabb, legtragikusabb hatású eseménye, a COVID-19 világjárvány idején ugyanis ezt a kisebb, addig jórészt ismeretlenebb vállalat nevét milliárdok ismerték meg. A cég egyik nagy sikerét jelentette, hogy a vakcináját – ellentétben a Pfizerével – normál hűtőben is tárolni lehetett 30 napig.

A Moderna, nevéhez méltóan, már kezdettől az MI-t hívta segítségül a fejlesztéseinél. A 2010-ben alapított cég az mRNS alapú kutatását helyezte előtérbe, úgy tekintve az mRNS-re, mint egy forráskódra. Emellett Stéphane Bancel vezérigazgatója víziója volt, hogy a Modernát az első naptól inkább digitális, és ne egy hagyományos gyógyszerkutató cégként építse fel. Így lett a Moderna az első digitális biotech vállalat. A digitalizáció, a felhőinfrastruktúra, az IoT adatok özönét eredményezte, amelyekre algoritmusokat fejlesztettek, hogy felgyorsíthassák a termékfejlesztést, az így kapott adatok alapján pedig tovább finomították az algoritmusokat. Az algoritmusok támogatják a Moderna döntéshozatalt, például a klinikai térben, ahol olyan előrejelzéseket adnak, amelyeket az emberek nem lennének képesek ésszerű időn belül megtenni. Az MI segít biztosítani a páciensek toborzásának és megtartásának sokszínűségét is, ugyanakkor azonosítja a potenciális lemorzsolódási pontokat, lehetővé téve a vállalat számára, hogy szükség esetén beavatkozzon és megakadályozza a lemorzsolódást.

Az MI-algoritmusok hasznosításával a Moderna gyorsan elemezheti a mutációkat, és rövidebb átfutási idővel hatékony vakcinákat fejleszthet ki. A mesterséges intelligencia 100 százalékban segítette a vakcinafejlesztés felgyorsítását, hiszen ez tette lehetővé számukra, hogy kitalálják, milyen mutációkat kell megcélozniuk.

A jövő? Csak a Moderna jelenleg közel 40-féle betegség legyőzésén munkálkodik, többek közt az elöregedő társadalmakat egyre jobban megterhelő onkológia területén. A jó hír, hogy ebben a cég nincs egyedül, de kiválóan mutatja, milyen előnnyel jár, amikor egy cég DNS-ében az MI döntő szerepet kap.

„Please note that as an AI language model, I am unable…”

A Tenesse Egyetem radiológusa, Som Biswas már 2022 végén rájött, hogy az orvosi tanulmányírásban a ChatGPT-3 mekkora segítség lehet. Publikálta is az erről szóló tanulmányát az amerikai Radiologist szakfolyóiratban. Azóta nála is átszakadt a gát, és ráérzett az algoritmus megkönnyítette publikálási folyamatra, hiszen négy hónap alatt 16 (!) szakcikke jelent meg a legkülönfélébb, nemcsak a szűkebb területével foglalkozó helyeken. A tudományos világ – nem utolsósorban presztízs, előrejutási és globális konkurencia megerősödése miatt – a minél gyorsabb és több publikálást, az arra való hivatkozást díjazza. Ahogy számítani is lehetett rá, a ChatGPT-vel „megtámogatott” tanulmányok jó része igen alacsony színvonalú. A könnyen hozzáférhető, kevés betanulás után sikeresen alkalmazható promptolás ráadásul megerősítette az úgynevezett „paper mills” jelenségét: ez a rosszindulatú, hamis tudományos publikációt gyártó feketepiaci vállalkozásokat jelenti.

Nem véletlen, hogy a figyelmetlen felhasználók a nagy nyelvi rendszerek által generált hibaüzeneteket sem veszik észre, és már a rangos holland tudományos kiadóvállalat, az Elsevier szűrőjén is átmennek az ehhez hasonló mondatokat tartalmazó publikációk: „Please note that as an AI language model, I am unable…”.

Igen, a hiba az ember készülékében van.

MI mindenhol

Természetesen minden vívmány gyermekbetegségekkel jár. Egy jó (Moderna) és egy rossz (összechatgptzett szövegek) példa után azért könnyen észrevehetjük, hogy a mesterséges intelligencia minden tudományterületen, felhasználási módban elterjed.

Erdőtüzek kiterjedését vizsgáljuk gépi látással? Az űrből figyeljük az erőműveket? Piaci folyamatokat akarunk előrejelezni? Az emberi agy működését szeretnénk jobban feltérképezni? A városi közlekedést kívánjuk optimalizálni?

A lehetőségek végtelenek, épp ezért az ezzel foglalkozók inkább utópisztikusabb célokat fogalmaznak meg, vigyázva, hogy azért nehogy idő előtt ígérjék meg például a legfontosabb ráktípusok elleni vakcinák várható elterjedését – még akkor is, ha minden jel szerint efelé tartunk.

További olvasnivalóként a témában Mérő László cikkét javasoljuk.

(Annyival egészítenénk ki a végét, hogy manapság a számítástechnika kifejezés helyett MI-t mondanak.)

Hogyan tanul a MI?

Iparág: Biztosítás

A mesterséges intelligencia ma már mindenhol ott van. Napjainkban tanúi lehetünk a felügyelt tanulás forradalmának: megtanítjuk a számítógépeket arra, hogy felismerjenek különböző mintákat – úgy, ahogy gyermekeinket is megtanítjuk olvasni. Azonban a MI jövője olyan számítógépes rendszereken múlik, amelyek maguktól is képesek tanulni, felügyelet nélkül.

Amikor egy édesanya rámutat egy kutyára és azt mondja gyermekének: „Nézd a kutyust!”, a gyermek megtanulja, hogy hívjuk a szőrös, négylábú barátainkat – az a felügyelt tanulás. Viszont amikor a gyermek feláll, majd újra és újra elesik, amíg meg nem tanul járni – az már egy egészen más jelenség.

A számítógépek is nagyon hasonlóan működnek. Ahogy mi, emberek nagyrészt megfigyelés és próbálkozás által tanulunk, úgy a számítógépeknek is túl kell lépniük a felügyelt tanulás fázisán azért, hogy ténylegesen elérjék (elérhessék?) az emberi intelligencia szintjét.

„Szeretnénk az olyan rendszerektől, amelyek rengeteg emberi tudást és manuális tanítást igényelnek elmozdulni az egyre inkább öntanuló rendszerek irányába (olyan irányba, ahol már egyre önállóbbak lehetnek)” – állítja David Cox, az MIT-IBM Watson AI Lab egyik igazgatója. Egy felügyelet mellett tanuló rendszer elolvashatná az összes könyvet a világon, de még akkor sem érné el az emberi intelligencia szintjét, hiszen a tudásunk (olyan) nagy része sosem lett leírva – tette hozzá.

A felügyelt tanulás címkézett adatokra támaszkodik: képi, hang- és szövegadatokon, amelyet emberek tömkelege készít elő - ezt tanítjuk meg a rendszereknek, ezáltal pontosan tudják, mit kell keresniük. Az algoritmus így könnyedén felismeri az emberi alakokat és biciklis közlekedőket az utcai forgalomról készült fényképeken – a képek milliói után pedig már bármikor felismeri azt, aminek keresésére betanítottuk.

A felügyelt tanulásnak azonban viszonylag erős korlátot szabnak a betanításhoz használt adatok és azok elképesztő mennyisége.

Azok a módszerek, amelyek nem támaszkodnak ilyen pontos emberi felügyeletre, kevésbé kutatottak és háttérbe szorulnak a felügyelt tanulás eredményei és alkalmazási területei mellett – az önvezető autóktól kezdve egészen a nyelvek egyre pontosabb fordításáig. Ezzel szemben felügyelt tanulás mellett a számítógépek még mindig sok olyan dologra sem képesek, amelyek akár egy kisgyermek számára is egyszerűnek bizonyulnak.

Ennek eredményeképpen a szakma élén járó tudósok most a kevesebb felügyeletet igénylő módszerek felé fordulnak, amelyeknek lehetséges formája az önfelügyelet, és az ehhez kapcsolódó módszerek – például az input egy részének rekonstruálása, majd újra felépítése.

További lehetőséget rejt magában a minimális felügyeletet igénylő megerősítő tanulás is, amely – az emberekhez hasonlóan – jutalom által segíti elő a fejlődést, ez a stratégia pedig bizonyos cselekvésekre ösztönzi és tanítja a rendszereket.

A mesterséges intelligencia területén tehát újabb áttörések várhatók – mi pedig kíváncsian figyeljük a fejleményeket, saját fejlesztéseinkkel pedig igyekszünk hozzájárulni az alkalmazási területek bővítéséhez.

i2 – Trendek, történetek, jövőkép

Iparág: Biztosítás

Miután az i2 szoftvercsalád kikerült az IBM berkeiből, a felhasználói közösségi élet is felpezsdült: 2023-ban újra megrendezték a régen hagyományosnak számító európai i2 User and Trainingkonferenciát. A három napos rendezvény a hálózatelemzési újdonságok, esetpéldák színes kavalkádja volt. Cikkünkben ebből „szemezgetünk”, összefoglaljuk benyomásainkat és bemutatjuk a legizgalmasabb újdonságokat, trendeket.

Analyst’s Notebook útikalauz

A hálózatelemzésekkel foglalkozóknak ismerős lehet az Analyst’s Notebook szoftver. Bűnüldözői berkekben immáron 30 éve használják fejlett vizuális elemzést támogató eszközként. A hálózati elemzés azonban nem csak bűnözői csoportok és bűnszervezetek felderítésére alkalmas. Az Analyst’s Notebook nem köti meg az elemző kezét abban, hogy hogyan képzel el egy hálózatot, milyen adatokkal, kapcsolatokkal, elemzési attribútumokkal tervez – hovatovább már a hálózati elemzés előkészítő fázisában az elemző felfedezheti, hogy ugyanazon adatok felhasználásával más kérdéseket is meg tud válaszolni, ha változtat a hálózat struktúráján. Az előbb említett rugalmasság és a struktúraalkotási kreativitás lehetővé teszi, hogy a szoftver képes legyen tranzakciós, forgalmazási adatok, mint telefonhívások, számítógépes hálózati forgalom, e-mail üzenetváltások, ki-belépés/útvonaladatok vagy bankszámla-tranzakciók elemzésére is.

Számos különböző iparág és szektor hasznosítja a szoftver képességeit. A hálózatelemzéssel elérni kívánt cél rendre eltér, az adatok, az elemzési termék, az eredmény gyakran bizalmas jellegű, üzleti, szolgálati vagy akár államtitok, így továbbadása erősen korlátozott – azonban a módszertani elemek, jó megoldások egymás között megoszthatók, támogatva az új felhasználók fejlődését, bővítve a tapasztalt elemzők eszköztárát.

Szoftver a színfalak mögött – felhasználó és fejlesztő

A felhasználói tudásmegosztás különösen fontos a felforgató technológia világában, ahol a munkájában elmerült elemző nap mint nap mesterséges intelligencia megoldások sokaságának megjelenését látja, mindeközben a hálózati elemző szoftverében a megszokott munkamódszere évek óta hellyel- közzel ugyanaz.

Az IBM úgy döntött, hogy a jövőben a felhő- és MI-megoldásokra fókuszál, ezért az i2 szoftverportfóliót értékesítette, és így az i2 portfoliómenedzsmentje visszakerült az i2 Group kezébe. Az i2 Group nagy lendülettel látott neki a platform megújításának: negyedéves, féléves ciklusokban érkeznek a frissítések. A felhasználói igények mentén számos belső fejlesztés zajlik, melyek, ha kellően sikeresek, a termékbe beépülnek, és mindemellett folyamatos a hibajavítás, a meglévő funkciók teljesítményének optimalizálása.

Történetek, melyek túlmutatnak a befektetés megtérülési mutatókon

Az i2 Group a felhasználói közösségi élet felpezsdítését is célul tűzte ki, ennek megfelelően a tudásmegosztás, az újdonságok kommunikációja, a felhasználói és partner kapcsolatépítési lehetőséget egy ernyő alá hozó i2 User and Training Conference (UTC) került megrendezésre Londonban 2023 szeptember végén.

Mike Barton, a Brit Birodalmi Lovagrend parancsnoki ranggal kitüntetett nyugalmazott rendőrtisztje, közvetlen stílusú előadásában kendőzetlenül mutatta meg a brit rendőrség útját, melynek során a hagyományos papír alapú ügyfeldolgozástól eljutottak a számítógépekkel támogatott ügykezelés és adatbázisépítés világa felé. A digitalizáció felé tett lépések a hatékonyság építőkövei, melyeket azonban – már 30 évvel ezelőtt is – a jogi keretek korlátoztak. Alapvető akadályt jelentenek a rendőri szervezetek területi munkamegosztását meghatározó illetékességi szabályok. Magyarországon is ismerős helyzet, hogy a folyó egyik oldala és másik oldala más megyéhez vagy más eljáró hatósághoz tartozik. A bűnözőket ez a dolog egyáltalán nem foglalkoztatja, a folyó mindkét oldalán ténykednek, sőt országosan és határon átnyúlva is. Az előadás több tragédiát bemutatott: sorozatgyilkosokat, akik kézre keríthetőek lettek volna, ha a szervezetek közötti együttműködés rendszeres adatcserére épül, digitális oldalról nézve pedig, ha meghatározott feltételek mentén, az adatbázisok együttesen elemezhetőek lettek volna. Ezt követően bemutatta azt a folyamatot, ahogy a rendőrtiszt a jövőbeli tragédiák elkerülésének érdekében forrásoknak jár utána és talál is megoldást: az i2 iBase adatbázist és i2 Analyst’s Notebook elemző eszközt. Sajnos a történet a felszín alatt még mindig nem az elvárt sikersztori, hiszen az adatbázisok együttes elérése nem jelenti az együttes elemzési képességet! De ebben is segít az iBase: a fenti hiányosságot képes áthidalni úgy, hogy közben a törvényi előírásoknak, adathozzáférési szabályoknak maradéktalanul megfelel. Jóérzést keltő eset példájával zárult az előadás, egy településre a bűnözés árnyékát vető, mindenkit markában tartó helyi bűnszervezet felszámolásával. A nyomozói rutin mellett az iBase köré épített bűnügyi elemzőrendszer segítségével hajtották végre e nem mindennapi fegyvertényt, egy teljes közösségnek adva vissza a normális polgári hétköznapokat, eltörölve a környék rossz hírét. Azoknak is érdekes az eset, akik a főkönyvek és számok világában élnek. A bűnszervezet felszámolása az állampolgárok felé kimutathatóan vagyoni hátrány megszűnését jelenti a helyi ingatlanterületek értéknövekedése révén, településszinten több millió font értékben. Ehhez hozzágondolva a bűnözéssel okozott kár vagyonelkobzással történő megtérülését, a jogsértő cselekmények megakadályozásával járó további károk keletkezését, az i2 szoftverek alkalmazásának megtérülése fontra és pennyre kimutatható.

i2 Connect – az új technológiai trend bemutatkozik

„Az adat az új i2 Connect adatcsatolókon keresztül érkezik meg az i2 Analyst’s Notebook felületére”. Ez nem egy újabb adattudományi Coelho, hanem a legújabb i2 Group technológiai trend.

Számos adatforrásnak az elemzésbe való bevonásának akadálya:

nem érjük el az adatot,
vagy csak úgy, hogy túl sok olyan adatot is kapunk vele, amit szabályozás okán nem kaphatunk,
vagy az adat elérése 2-3 éves fejlesztési projekt kezdeményezését jeleni,
vagy tudnánk kezelni az adatot, de arra nincs törvény által biztosított felhatalmazásunk,
vagy üzleti szempontból nézve, nem éri meg adatbázisban tárolni az adatot.

Az i2 Connect adatcsatolók jelentik a megoldást külső adatbázisok eléréséhez vagy belső nem iBase adatbázisokhoz való csatlakozás céljára.

Külső adatbázis lehet például: partnernél, kormányzati szervnél, nonprofit szervezeteknél található adatbázis, illetve az i2 Group vagy partnerei által lefejlesztett, meglévő alkalmazásokhoz kapcsolódó adatbázis.

Egy saját i2 Connect adatcsatoló beállítása egy mini fejlesztési projekt – ami tiszta munkaidejét tekintve, amennyiben az igények összeállításra kerültek és a környezet rendelkezésre áll – inkább napokban, mint hetekben mérhető.

Létezik „dobozos”, előre elkészített i2 Connect adatcsatoló. Az i2 Online keretében elérhető számos, az i2 Group által lefejlesztett és üzemeltetett csatoló, melyek olyan szolgáltatásokat tartalmaznak, amelyek segíthetik az elemző munkáját:

mint nemzetközi cégadatbázis kockázatkezelő modullal, OSINT megoldás elemeket tartalmazó szolgáltatáskosár,
internetes malware információk,
geoadatkódolást támogató keresés,
vagy az internet történeti adatbázis, a Wayback Machine.

i2 újdonságok és jövőkép

2024-ben érkeznek új, hasznos funkciók a meglévők kiegészítéseként és nagyobb alkalmazásmodulok egyaránt. A fejlesztés irányait elsősorban a felhasználói igények határozzák meg. A teljesség igénye nélkül nézzük meg, mit hoz a jövő:

az Analyst’s Notebook-ot követően az iBase is 64 bites programkódra áll át, ami számos jövőbeli teljesítményoptimalizáció és fejlesztés alapja,
a termékportfolió rendezés megtörtént, 4 fő termék van az alábbi célokra:
- Analyst’s Notebook – egyedi, ad-hoc elemzések eszköze,
- iBase - professzionális hálózati elemzést támogató adatbázis,
- Analysis Studio - az Analyst’s Notebook kiegészítve adatbázis-csatolókkal és Chart Store-ral,
- Analysis Hub – testreszabható nagyvállalati megoldás.
Elindul az i2 Online – külső szolgáltatók adatai érhetőek közvetlenül az Analyst’s Notebook felületéről a partnerekkel együttműködésben fejlesztett és üzemeltetett adatbázis csatolók segítségével (pl. Orbis, VirusTotal, ShadowDragon, stb).

Felhasználói igények mentén, a következő verziók tartalmazhatnak a közeljövőben

szabad nyelvi lekérdezéssel támogatott elemzési asszisztenst,
térbeli és időbeli adatok egyszerű importálását, gyorselemzését támogató modult.

Az i2 Group és partnereinek szolgáltatásai, termékei már jelenleg is számos olyan, az adatcsatolók és egyedi szoftverfejlesztés határán mozgó megoldást kínálnak, amelyek túlmutatnak a komplex elemzési feladatokon, az Analyst’s Notebook a munkavégzési folyamatba szervesen integrálódik:

a hadügyi, védelmi parancsnoki központok támogatását ellátó megoldások az elemző számára lehetővé teszik, hogy a kapott hírterméket egy gombnyomással a terepen lévő katonák részére továbbítsák közvetlenül az alkalmazásból,
a kiberbiztonsági területen az Analyst’s Notebook felületén megtalálható entitásokhoz IT-logika mentén kapcsolódó tevékenységek láthatóak el: pl. tűzfalbeállítás, felhasználó vagy munkaállomás letiltása.

Az újdonságok sokaságából kitűnik egy üzenet, a körvonalazható stratégia 2024-re: az i2 Group az IBM családból kikerülve még jobban meg kívánja erősíteni piaci jelenlétét ügyfélcentrikus fejlesztésekkel, innovációkkal, önálló termékekkel, integrációval, ügyfél igényekhez igazított megoldásokkal.

Találkozzunk a 2024-es konferencián Londonban!

Csatlós Béla

Japán, Dél-Korea és az MI

Iparág: Biztosítás

Amikor a mesterséges intelligencia, különösen a generatív eszközök kerülnek szóba, legtöbbször amerikai vagy kínai, nagyritkán európai cégekről beszélhetünk. De hol tart az MI-versenyfutásban a két másik, technológiailag fejlett ország, Japán és Dél-Korea? Cikkünkben ebbe adunk betekintést.

MI Made In Japan

Japánnak a mesterséges intelligenciához való hozzáállását az emberközpontúság jellemzi. A kormány 2019-ben közzétett „Az emberközpontú MI társadalmi alapelvei” című dokumentum az emberi méltóság és értékek tiszteletben tartását, a társadalmi jólét és a sokszínűség előmozdítását, valamint a bizalom és az együttműködés erősítését hangsúlyozza.

A japán szabályozási megközelítés a kockázatokra épülő, agilis és több érdekelt felet bevonó folyamatot követi. Az ország célja, hogy maximalizálja a generatív MI pozitív társadalmi hatását, miközben minimalizálja annak negatív következményeit. A "Data Free Flow with Trust" (DFFT) keretrendszer ösztönzi az adatmegosztást és -felhasználást a köz-, a magánszféra, valamint a nemzetközi szereplők között. Mivel az adatvédelem, a biztonság és az etikai szempontok kiemelt fontosságúak, ezért a keretrendszer a bizalmat helyezi a középpontba.

Japán azonban lemaradásban van a saját nagyméretű nyelvi modelljei (LLM-ek) fejlesztésében az Egyesült Államokhoz, az EU-hoz és Kínához képest, ami a számítástechnikai és emberi erőforrások hiányára vezethető vissza. A kormány ezért jelentős beruházásokat hajt végre a kutatás-fejlesztésbe olyan programok és projektek révén, mint a rendkívül ambiciózus Moonshot Kutatási és Fejlesztési Program (MRDP) és a Mesterséges Intelligencia Stratégiai Tanács (AITSC). Az ország a Fugaku szuperszámítógépet is felhasználja a japán adatokon alapuló nagyméretű nyelvi modellek fejlesztésére, de a magánszektor is erőfeszítéseket tesz a szükséges infrastruktúra kiépítésére. Japánban már most számos figyelemre méltó startup működik a generatív AI területén, köztük egy nagyon ígéretes cég.

Japánul beszél

A Kotoba Technology egy határokon átnyúló startup vállalkozás, amelyet Dr. Noriyuki Kojima és Dr. Jungo Kasai professzor alapított. Mindketten az Egyesült Államokban végezték el a mesterséges intelligencia doktori programot, így szakértelmükkel egyesítik az amerikai és japán csúcstechnológiás NLP (természetes nyelvi feldolgozás) és HPC (nagy teljesítményű számítástechnika) területeit. (A Kotoba japánul egyébként egyszerűen „nyelv”-et jelent.)

A Kotoba Technology története akkor kezdődött, amikor az alapítók felismerték a GPT-3 angolközpontúságát. Ekkor határozták el, hogy kifejlesztenek egy japán nyelv fókuszú, nagyméretű nyelvi modellt, kihasználva a Fugaku szuperkomputert, ami akkoriban a világ második leggyorsabb számítógépe volt. A startup az LLM-ek telepítésében át szeretné hidalni az angol és a nem angol nyelvek közötti szakadékot.

A Fugaku projektben a jó csapat felépítésének sikerére építve az alapítók most arra törekszenek, hogy kutatókat és fejlesztőket hozzanak össze az LLM-ek gyakorlati alkalmazásának felgyorsítására. A Kotoba Technology csapatában olyan emberek is dolgoznak, akiknek tapasztalatuk van a Fugaku és az ABCI szuperszámítógépek használatában, valamint olyan nagyszabású, kormány által finanszírozott LLM-projektekben mint az LLM-JP.

A Kotoba állítása szerint az első end-to-end foundation modelljük, a Kotoba-Speech 0.1 beszédminőségében felülmúlja az Amazon, az Elevenlabs és a Google termékeit is.

Dél-Korea: ambiciózus célok és technológiai innováció

Dél-Koreában a generatív MI-piac gyorsan növekszik, és 2024-ben várhatóan eléri az 1,3 milliárd dollárt. Ez az összeg még mindig jelentősen elmarad az Egyesült Államok körülbelül 23 milliárd dolláros piacától, ráadásul minden negatív esemény visszaveti az adaptációs kedvet. Ilyen volt például 2023 júliusában, amikor 687 dél-koreai ChatGPT-felhasználó személyes adatai szivárogtak ki, beleértve a hitelkártya-adatokat is. Ez az incidens aláásta a közvélemény bizalmát a generatív MI-vel, és különösen a ChatGPT megbízhatóságával kapcsolatban.

Hiába a K-pop kontinenseken átnyúló népszerűsége, a generatív mesterséges intelligenciában nem a koreaiak diktálnak, hiszen hatalmas lemaradásban vannak, és aggódnak a meglévő angol nyelvű chatbotok kulturális és nyelvi elfogultsága, az amerikai vállalatok dominanciája miatt. Válaszul a dél-koreai cégek a koreai fogyasztókra szabott, lokalizált stratégiákat alkalmaznak. Céljuk, hogy olyan piaci réseket célozzanak meg, amellyel az amerikai és a kínai vállalatok eddig nem törődtek.

A Samsung, jelentősége és mérete miatt, a generatív MI globális piacán kíván előretörni. A cég 2023 végén már bemutatta a Gauss-t, egy sokoldalú generatív MI-modellt, amely egy kifejezetten a koreai nyelvre optimalizált nyelvi, egy kódolást segítő és egy képalkotó modellből áll. Idén már a Gauss 2-nél tart a fejlesztés, amelynek célja, hogy a Samsung legújabb okostelefonjaiba – és később más termékeibe – a Google és az Apple MI-modelljeivel minimum egyenrangú, de ha lehet, még erősebb mesterséges intelligencia kerüljön.

Játékprogramozók, értetek jöttünk – mondta az MI

Iparág: Biztosítás

0% programozói tudás, 100% játékok

Javi Lopez, egy spanyol befektető és AI evangélista nem várta meg, míg körmére ég a GPT-4 alakú gyertya. A képzavarból kikecmeregve, a történet lényege egyszerű és fenomenális: a programozói tudással nem rendelkező szakember pusztán az Open AI március 14-én bemutatott újabb algoritmusának használatával tulajdonképpen már aznap, 30 másodperc (!) alatt megírt egy TETRIS-játékot HTML-ben és Javascriptben. A helyes kifejezés persze a „megírt” helyett inkább az: „megíratott”, hiszen a GPT-4-gyel történő párbeszéd, a beírt promptok hatására állt elő villámgyorsan ez a rövid, de működő kód. De akadt olyan, aki még ennél is tovább ment.

A dizájnmenedzser Ammaar Reshi ugyancsak még idén márciusban, a friss, ropogós GPT-4, valamint a Replit, a Midjourney, a Claude, vagyis egy seregnyi AI segítségével újraalkotta gyermekkorának egyik kedvenc 3D-s lövöldözős játékát, a SkyRoads-ot. A trükk? „Csak” annyi, hogy Reshi egy árva kódsort sem ért a 3D-s programozáshoz, viszont kiválóan dirigálta a mesterséges intelligencia eszközeit. (Az egész folyamat jól dokumentálva végigkövethető itt.)

Lufi, veszély vagy áldás?

Áprilisban a Stanford Egyetem kutatóinak egy csoportja, a Google-lel karöltve bemutatta a Smallville névre keresztelt virtuális világot. A kísérleti projekt célja az volt, hogy AI segítségével egy, a The Sims-hez hasonló, de okosan, önállóan működő karakterekből felépülő világot teremtsenek. A művi szereplők ráadásul elég intelligensen, sokféle témában beszélgethetnek egymással. A tanulmányban bemutatott, 48 órán át tartó szimuláció nem volt olcsó mulatság, hiszen 5000 dollárnyi GPT-tokent égetett el, és a végeredmény meg sem közelíti az olyan emberi csúcsteljesítményt, mint amilyen például a Human: Detroit című játék.

Az iparági szakembereket kérdezve a válaszok nagyjából egy irányba mutatnak. Eszerint – ahogy például más kreatív munkákban is – jól láthatóak a nagy nyelvi modellek vagy text-to-video alkalmazások korlátjai: ember kell az inputhoz, a megítéléshez és a finomításhoz, illetve nagyon sok részfeladatot (nincs rá jobb szó) az AI-k elég bénán hajtanak végre. Döcög a szöveg, az ötlet, a narratíva, úgy érezni, hogy ezt nem egy világszínvonalú cég készítette.

Mindenesetre a nagy szereplők egyike, a francia Ubisoft az elsők közt szeretne lenni a technológia alkalmazásában és kiaknázásában. Ezért hozta létre házon belül a Ghostwriter nevű mesterséges intelligenciát, amely elsősorban az úgynevezett NPC-k (Non-Playable Characters) párbeszédeit érinti: ezek azok a videojáték-szereplők, amelyeket nem az ember mozgat, de színesítik a játékot. Az Ubisoftnál úgy vélik, hogy léteznek kisebb, időigényesebb feladatok, amelyeket az AI gyorsabban megold, és az embereknek így több idejük marad a fontosabb munkafolyamatokra.

Az innováció természetesen sok játékfejlesztőnél kiverte a biztosítékot. Ellenkezésük a következő két pontban foglalható össze:

az ilyen eszközökre fordított összeget inkább további emberek felvételére költsék,
sokszor az AI által recsegősen megírt párbeszédeket és kódsorokat egyszerűbb az embereknek a nulláról megalkotni, pont az AI kontextust nem ismerő hiánya miatt.

Ahogy látható, ebben az iparágban is a kísérletezés, az optimalizálás zajlik. Ahogy a játékfejlesztésben használt AI-k is egyre jobban fognak muzsikálni, úgy várható, hogy az ezzel kapcsolatos társadalmi-jogi vélemények, a reakciók is egyre pontosabbak lesznek. Ahogy a digitális világ előttről származó mondás is tartja: fontos, hogy a kecske is jóllakjon és a káposzta is megmaradjon.

Jöhetnek a robotfőnökök, avagy MI a HR-ben

Iparág: Biztosítás

Hogyan lehet egy kimondottan emberekkel foglalkozó területre a mesterséges intelligenciát beépíteni? Az eddigi fejlemények egyszerre bíztatóak és felemásak. Annyi azonban biztos, hogy még csak az út elején járnak az MI és a HR összehozásán dolgozók, még akkor is, ha sok lehetőséget rejt ez a nem mindennapi párosítás.

MI, te szexista lettél!

Az ilyen epizódokra a mesterséges intelligenciák tervezésével foglalkozó közösség fejcsóválva, a hétköznapi ember pedig értetlenkedéssel reagált. A hír még ChatGPT előtti időkből származik, de még ma is visszhangzik, mivel az Amazonhoz kötődik. 2014-ben az online piactér óriása ugyanis nemes céllal kezdett MI fejlesztésébe: egy csapatot hozott létre, hogy megalkossanak egy olyan mesterséges intelligenciát, amely a hozzájuk jelentkezők tömegéből elfogulatlanul választja ki a legrátermettebbet. Az elképzelés szerint a férfiak dominálta munkaerőpiac igazságtalanságát jól orvosolná egy gépi tanuláson alapuló rendszer, amely a nemek ismerete nélkül rangsorolja az adott állásra beérkező pályázatokat, egytől ötig értékelve azokat.

Azonban 2015-ben kiderült: az MI sem semleges. Ennek oka a bevitt adatokban keresendő: a legutolsó 10 év felvettjeiből mintát képező algoritmus a férfiak dominálta munkaerőpiaci sajátosságokat figyelembe véve semlegesen a férfi jelentkezőket részesítette előnyben. Büntette azokat az önéletrajzokat, amelyekben a „női” szó szerepelt, például a „női sakk-klub kapitánya”. További tanulságos érdekesség, hogy a technológia előnyben részesítette azokat a jelölteket, akik a férfi mérnökök önéletrajzában gyakrabban előforduló igékkel jellemezték magukat, mint például az „executed" és "captured".

Nem most kezdődött, csak lendületet kapott

A toborzással foglalkozó szakemberek már vagy két évtizede használnak olyan eszközöket, amelyek az önéletrajzokban szavak, kifejezések keresésével szűrik ki a nem releváns jelölteket. Az úgynevezett Automated Recruitment Software-ek kategóriájuk nevéhez méltóan automatizálják a folyamatokat: az álláskeresők megtalálását széles bázisból, az álláshirdetések publikálását, a felvételi eljárás menetét (teszt, válasz), képesek a prediktív elemzésre és a riportok készítésére is.

Megjósolja a legjobbakat?

Az optimális jelölt megtalálásához a generatív MI újabb lökést ad: például a marketing- és reklámügynökségek arról számolnak be, hogy a ChatGPT vagy a Bard sok munkát takarít meg nekik a pozíciók elvárásainak megfogalmazásában. Így több idejük marad a szakembereknek az „emberi” munkafolyamatokra, például egy-egy jelölt portfólióját átböngészni. A generatív MI ráadásul képes például a globális világból történő felvételt megkönnyíteni, méghozzá az amerikai bevándorlási törvények jogi szövegének summázásával. Ezen kívül már előfordul, hogy a más nyelvű jelölttel való kommunikációt is rugalmasan megoldják a ChatGPT-vel.

Egy olyan gépi tanulást alkalmazó toborzási platformmal kombinálva, mint a hireEZ, a generatív MI ráadásul olyan online körökre is kiterjesztheti a keresést, mint a Reddit alközösségek (subredditek), fejlesztői fórumok és a történelmileg afroamerikaiak körében népszerű főiskolák és egyetemek öregdiákcsoportjai.

Most már – különösen az Amazon jó szándékú fiaskója után – a generatív MI csökkentheti az előítéletességet is, például úgy, hogy segít azonosítani a munkaköri leírásban szereplő, férfias jellegű kifejezéseket, amelyek visszatarthatják a nőket a jelentkezéstől (ilyenek a „driven”, az „objective” vagy a „determined”).

A LinkedIn és a szépírók forradalma

Az üzleti közösségi média, a LinkedIn is bevezette a maga MI-segédeszközét, ami értelemszerűen a jobb profil kitöltésében segíti a munkát keresőket. Ez egy újabb problémához vezet, amely általánossá válhat a nagy nyelvi rendszerekre épülő, szöveggenerálásban alkalmazott chatbotoknál is. A toborzók ugyanis már most szembesülnek a legmenőbb – és ugyanolyan! – kulcsszavakat tartalmazó önéletrajzok özönével. Magyarán: az eszköz, amely az egyéni megkülönböztetésben óhajt segíteni, hasonló végterméket produkál mindenkinek, vagyis épp a célját nem éri el. Ahogy egy HR-es szakember nyilatkozta: „hirtelen mindenki kiválóan fogalmazó íróvá vált”.

A jövő munkái és munkahelyei

Végül természetesen nem lehet szó nélkül elmenni a mindenkit érdeklő kardinális kérdés mellett: vajon hogyan befolyásolja a mesterséges intelligencia a jövő munkahelyeit? A teoretikus és a nagyon praktikus válaszokon túl a helyzet új kihívások elé állítja a HR-eseket. Először is, mennyire lehet megkövetelni (és milyen mélységben) a jelöltektől az MI-szaktudást? Másodszor, hogyan lehet az egyes pozíciókba beépíteni az MI használatát? Ráadásul – ahogy ez már minden technológiai váltásnál történt – új állások jönnek létre, amelyhez meg kell találni a megfelelő embereket. Ilyen például a Fiverr, a szabadúszókat összegyűjtő platformon az MI tanácsadó vagy a ZipRecruiteren feltűnt MI kreatívigazgató is. Nekik vajon milyen álláshirdetést kellene megfogalmazni?

Az pedig végképp a jövő zenéje, mit szól mindehhez a nem technológiai háttérből jövő átlagdolgozó. Némiképp érdekesen jó hír, hogy idén, a Business Name Generator nevű MI-szolgáltatás több ezer amerikai dolgozót kérdezett meg, hogy mit szólnának egy MI-főnökhöz. Nos, a felmérésben résztvevők ötöde üdvözölné a lépést – mondván, hogy egy ilyen főnök kevésbé lenne elfogult, mint jelenlegi feljebbvalójuk.

Jürgen Schmidhuber, az MI legendája

Iparág: Biztosítás

A 2024-es fizikai Nobel-díjat sokak meglepetésére két, a mesterséges intelligencia kutatásában történelmi érdemeket szerzett szakember, az amerikai John J. Hopfield és a legendás, brit Geoffrey E. Hinton nyerte. Az MI többi, még ugyancsak élő és aktív tagjai (például Yann LeCun, Eliezer Yudkowsky, Ilya Sutskever vagy éppen Yoshua Bengio) mellett azonban a szakmai körök hol viccesen, hol teljesen komolyan emlegetik egy német számítógéptudományi szakember, Jürgen Schmidhuber nevét. Sokan úgy vélik ő az, aki talán a legfontosabbat alkotta a mélytanulási hálózatok terén – míg mások szerint egy zseniális képességű, izgága alak, aki magának követeli az elsőséget és az elismerést.

Kicsoda Schmidhuber?

A német férfi már az 1970-es években megszállottja lett annak, hogy intelligens gépek megalkotásával még nála is okosabb „teremtményeket” hozzon létre. A müncheni Műszaki Egyetemen szakdolgozata a végső önfejlesztő gépekről szólt, amelyek nem csak az ember által előre megtervezett tanulási algoritmuson keresztül tanulnak, hanem magát a tanulási algoritmust is megtanulják és továbbfejlesztik. Ez az ötlet évtizedekkel előzte meg korát, hiszen abban az időben épp egy újabb AI Winteren (az MI-kutatások befagyasztásán) volt túl a szakma, de még se hardver, se algoritmusok, se nagy adatok nem álltak rendelkezésre a robbanáshoz. Hősünk mindenesetre Münchenben doktorált 1991-ben, méghozzá a modern mesterséges intelligencia alapjait lefektető munkájával.

Tényleg a legbefolyásosabb MI-tudós?

Schmidhuber – és a tudományos iratok idézését számontartó Google Scholar – szerint a 20. század legtöbbet idézett, neurális hálózattudománnyal foglalkozó tudományos szakcikke az ő müncheni tanítványával, Sepp Hochreiterrel elkészült 1997-es Long-Short-Term Memory (LSTM), amely számos, akkor aktuális gépi tanulási problémára nyújtott megoldást. Ennek egy variánsa, a „vanilla LSTM-architektúra” gyakorlatilag minden mai, naponta használt rendszer alapja – ilyet találunk például a Google Translate-ben, más fordítóalgoritmusokban, de ezt használják olyan területeken is, mint az egészségügy, robotika, beszédfelismerés (Alexa, androidos mobiltelefonok). Ezt az architektúrát szintén Schmidhuber tanítványai alkották meg.

A német kutató X-fiókja melletti leírás nem is lacafacázik, egyszerűen így jellemzi őt: „Feltalálta a meta-tanulást (1987), a GAN-okat (1990), a Transformerst (1991), a nagyon mély tanulás (1991) stb. elveit. A mesterséges intelligenciánkat naponta sok milliárdszor használják.”

A Bloomberg és sokan mások az MI egyik atyjaként emlegetik, és Schmidhuber nem is szégyelli folyton a szakmabeliek orra alá dörgölni, hogy az ő és tanítványai 1990-91-es eredményei nélkül nem tartana itt a mesterséges intelligencia. Szó nincs arról, hogy ne ismernék el, hiszen rengeteg neves díjat kapott már. Csak éppen ezzel ő nem elégszik meg.

Egy ellentmondásos figura

Minden fenti érdeme igaz. Mégis, inkább arról lett híres (hírhedt?), hogy az egyébként egymással gyakran vitatkozó, de kollegiális MI-tudósok között dühödten támadja azt, aki nem ismeri el az ő és csapata jelentőségét, elsőségét. A szakmabeliek körében el is terjedt a német nevéből képzett "schmidhuberezni" kifejezés. Ezt arra használják, amikor valaki nyilvánosan megkérdőjelezi más kutatók munkájának eredetiségét. Ez a tudományág, amely egymás után következő generációk eredményeire építi az újabb felfedezéseket, érzékeny a konfrontatív Schmidhuber hozzáállására – noha a tények nagy valószínűséggel azt mutatják: a németnek alapvetően igaza van.

Apropó: külön bejegyzést írt az X-re az idei két fizikai Nobel-díj kiosztásáról, amely szerinte a plagizálást jutalmazta. (A cikk, ahogy a német többi számonkérő írása is, pontosan lábjegyzetelt, mindenki eldöntheti, hogy igaza van-e…)

Az idén 61 éves szakember ma is aktív, és a Swiss AI Lab IDSIA tudományos igazgatójaként továbbra is azon a területen alkot, amelyben tizenévesen beleszeretett.

Manapság sokat hallatja a hangját az MI veszélyeiről, miközben a jövőről optimista és nagyívű képet fest: „néhány tízmilliárd éven belül kíváncsi, önfejlesztő mesterséges intelligenciák fogják gyarmatosítani a látható kozmoszt olyan módon, ami az ember számára megvalósíthatatlan. Úgy hangzik, mint egy sci-fi, de az 1970-es évek óta nem tudok elképzelni egy hihető alternatívát erre a forgatókönyvre, kivéve egy olyan globális katasztrófát, mint egy totális nukleáris háború, amely megállítja ezt a fejlődést, mielőtt beindulna.”

Kedves MI, létezik-e Isten?

Iparág: Biztosítás

Bár napjainkban látszólag a vallás nem játszik nagy szerepet az emberek életében – legalábbis Európából nézve – világszinten azonban már más képet kapunk. A rangos Pew kutatóközpont átfogó felmérése szerint ugyanis a Föld lakosságának mintegy 84%-a mondja magát valamilyen valláshoz tartozónak. A népesedési, demográfiai adatok szerint ez a helyzet a közeljövőben sem változik számottevően. Hogyan kapcsolódik az emberek transzcendens utáni ősi vágya a 21. században felpörgő MI jelenségéhez? Néhány példával illusztráljuk a két távol eső terület összekapcsolhatóságát, átjárhatóságát ebben a cikkben.

Jó hírek Németországból és Pekingből

Ha azt gondolnánk, hogy csak mostanában került elő a vallás és mondjuk a robotika kapcsolata, akkor bizony tévedünk. A világhírű sci-fi szerző, Robert Silverberg 1971-es, az év legjobb science fiction elbeszélésének járó Nebula-díját elnyerő írásában, a főszereplők az új robotpápát: VII. Sixtust ünneplik. A Jóhírek a Vatikánból című, több mint fél évszázados szatirikus írás, ma kezd valósággá válni, még ha kisebb lépésekben is történik.

A Peking külterületén élő Xianfan mester a kínai kutatókkal együttműködve hozta létre a rendkívül kedves kinézetű Xian’er robotot. (A név olyasvalakire utal, aki sokáig él, esetleg halhatatlan.) A 2016-ban bemutatott kis szerkezet reagál a hangokra, megválaszol egyszerűbb kérdéseket a buddhizmussal kapcsolatban, sőt, még mantrázni is képes.

Egy évvel később egy ennél kicsit fapadosabb, MI-t nyomokban sem tartalmazó, többnyelvű áldásosztó robotot próbáltak ki Németországban a reformáció 500. évfordulójának tiszteletére.

E két kísérlet mindegyikében az egyházi, vallásos személyek egyrészt át akarták törni az élő/mesterséges közötti válaszfalakat, megmutatva, hogy a vallás közvetítője nemcsak ember lehet. Míg az európai példa elsősorban a papokban, lelkészekben egyre nagyobb hiányt szenvedő szituációra ad(hat) megoldást, addig a kínai példa a digitális életbe beleszülető, jobbára materialista rétegeket célozza meg.

Prédikáló ChatGPT

Ha a nagy nyelvi rendszerek képesek szinte bármilyen szöveget előállítani, akkor miért maradna ki az istentisztelet? Így gondolkodott a 29 éves Jonas Simmerlein is, aki 2023 júniusában a kétévente megrendezett Deutscher Evangelischer Kirchentag-ot teljes egészében a mesterséges intelligencia generatív képességeire bízta. Ennek jegyében a negyvenperces istentiszteletet négy MI-avatár „vezette”, és a prédikációt is a ChatGPT írta meg. A kísérlet megosztotta a résztvevőket: főleg az idősebb korosztály lélektelennek tartotta a szentbeszédet, de a jelen lévő csoportnyi tinédzsernek tetszett az „előadás”. Mindenesetre, az összegyűltek jót nevettek, amikor az avatár a gyakori ima és templomba járás fontosságára hívta fel a hívek figyelmét.

Ez az esemény – amely egyébként már itthoni templomban is lejátszódott – jó példa arra, hogy a technológia elterjedése némely területeken nemcsak gyorsabb, hanem magától értetőbb is. A szent és a profán, az egyházi és a világi ilyen összekeverése elsőre furcsának tűnhet. De nem meglepő, ha tudjuk: a tudomány, a technológia történetében a vallás rendkívül fontos szervező erő volt – a könyvnyomtatás egyik céljának például pont a nemzeti nyelvű Bibliák elterjesztése számított, de a rádió megjelenésekor az Egyesült Államokban hamar megjelent és elterjedt a rádiós prédikáció.

Talán a mostani MI-hullámhoz több idő, kísérletezés kell ezen a téren.

Saját vallás, saját chatbot

Ahogy az OpenAI lehetővé tette a ChatGPT-4 API-jára épülő chatbotok létrehozását, a ”legszemélyesebb közügy”, a vallás sem maradhatott ki a sorból. Hamar elérhetővé is lettek a különböző vallásokra épülő algoritmusok, amelyekkel élet és halál, elkárhozás és üdvösség, szabályok és parancsolatok témakörében lehetett elmélyült beszélgetéseket folytatni. A nagyon gyakorlatias amerikai protestáns felekezetek némelyike kibővítette a csupán válaszolgatós lehetőséget, és a generatív MI-t szervezési, illetve egyházi eseménytervezési célokra is felhasználták.

A chatbotok esetében a hangsúly a személyes törődésen van: ha a pásztor/imám/rabbi nem ér éppen rá, akkor is fel lehet tenni a kínzó, válaszra váró kérdéseket – ez esetben a chatbotok tanítási korpusza a nagy vallások szent szövegeiből és kommentárjaiból került ki.

Szellem a gépben

Vallás szempontjából a legnagyobb kérdést azonban az jelenti, hogy az élettelen öntudatra kel-e valamikor? Másképpen kérdezve: az emberi agyat imitáló megoldások, az egyre hatékonyabb algoritmusok, kifinomult, MI-re tervezett csipek használatával vajon lesz-e lelkük az ember teremtményeinek? Felbukkan-e olyan öntudat, amely nemcsak tisztában van saját létezésével, de arra reflektál, sőt, mortalitásának tudatában esetleg a végső válaszokat kutatja-e? Érdekli-e majd, hogy mi lesz az öntudatával a kikapcsolása után?

Akárhogyan is történik, cikkünk végére megint csak a science fiction irodalom egyik klasszikus alkotását kell idéznünk. (Az írók ugyanis jó előre megsejtették a ránk váró problémákat.)

Frederick Brown 1954-es rövid írásában (A válasz) a világűrbe kirajzott emberiség elkészíti a szuperszámítógépet. Ahogy bekapcsolják, felteszik neki az első és legfontosabb kérdést: van-e Isten? Igen, már van Isten – szól a válasz, és az új komputer hatalmas villámmal agyonsújtja a kérdést feltevő tudóst.

Imádkozzunk, hogy ne így történjen a valóságban, de azért tartsuk szárazon a puskaport is!

Keleti kémszemek és strázsák, avagy MI-ből lesz a jó csendőr?

Iparág: Biztosítás

A filmek már régóta figyelmeztetnek a mesterséges intelligencia, a robotika alkalmazásainak mélyreható következményeire. Hol azt mutatják be, hogy az ember mindenképp kell az egyenletbe (Robotzsaru, 1987.), máskor pedig a mindent látó, a rólunk majdnem mindent tudó rendszer veszélyeit öntik akciófilmbe (Különvélemény, 2001.). Ami még négy, sőt két évtizede hollywoodi lázálomnak minősülhetett, annak megvalósítása felé öles lépteket tettünk az MI és a bűnüldözés párosításával.

Nem Szauron szeme, de (majdnem) mindent lát

A hétköznapi, ma már teljesen megszokottá vált „mindenkit megfigyelnek” életérzés legerősebben a kínaiak számára átélhető jelenség. Az 1,3 milliárd lélekszámú országban ugyanis körülbelül 770 millió (!) megfigyelőkamera (CCTV) működik, ami a világ összes kamerájának a felét jelenti. Önmagában még ez a tény pozitívummal is járhat – gondoljunk csak arra, hogy ez csökkenti a kisebb bűncselekmények előfordulásának lehetőségét (ezt itthon is tapasztalták a szakemberek, például az autófeltöréseknél). Amikor azonban a mesterséges intelligencia képfelismerő algoritmusa belép a képbe, rögtön szürkébbé válik a megítélés. Kína vezeti azt a rangsort is, amelyben az arcfelismerést használó országokat rangsorolják. A szuperhatalommá váló, egypárti diktatúrában élő lakosok számára az orwelli 1984-ben leírt teleképes jelenet elevenedhet meg. Néhány példa: Sizhou városában e technológia ismerte fel, hogy hét ember pizsamában hagyta el otthonát, és ezért megszégyenítették őket. A pekingi Ég Temploma nevű turistalátványosságban viszont az elharapózott vécépapír-lopások miatt vetették be az arcfelismerő rendszert: bele kell nézni egy kamerába, amely az adott vécéhasználónak csak két adagnyi toalettpapírt adagol – ha többre lenne szüksége, akkor 9 percig kell feszesen ülnie a vécén, míg újra papírhoz juthat. Ezzel megoldani látszik egy probléma, de azért generál jó pár kérdést is.

Szabályozás után kiált

Apropó, etika! Az arcfelismerő rendszerek használata amúgy is forró téma. Ennek oka, hogy a kínai kameragyártókra már több éve az ottani kormány árnyéka vetül. Magyarán: sok nyugati politikus, szakember attól tart, hogy az adatlopási ügyekbe túlságosan sokszor belekeveredő ország termékei gyakorlatilag kémkedést (is) végeznek. Ezért például az USA-ban egy 2019-es törvény (2019 National Defense Authorization Act) tiltja bizonyos kínai gyártók termékeinek kormányzati beszerzését, kritikus információs infrastruktúrákba beépítését.

Az Európai Unió a világ első, a mesterséges intelligencia használatát szabályozó törvényében (AI Act) úgy döntött, hogy tilos élő távoli biometrikus azonosítást alkalmazó MI komponensekkel támogatott rendszereket építeni. Az utólagos videófelvételek mesterséges intelligenciával történő feldolgozásának a szabályozás szabad utat enged, de szigorú megkötésekkel. A bűnüldözési tevékenységet támogató információfeldolgozás megengedett, ellenben szigorúan korlátozott: a nyugati világban elfogadott etikai és jogi normák mentén tilos szociális pontozást, személyre szabott bűnelkövetés predikciót, érzelem-beazonosítást alkalmazni.

Az igazi robotzsaru

Igen, kis r-rel, hiszen nincs még neve a Dubajban 2017-ben munkába állított humanoid robotnak. A gyors tempóban fejlődő, modern város bevásárlóközpontjainál és turisztikai látványosságainál strázsáló szerkezetek – más robotokkal, például drónokkal is együttműködve – a mesterséges intelligencia alapú arcfelismerést használják, több nyelven beszélnek és észreveszik azt is, ha valaki szelfizni akar a robottal (nyájasan meg is engedik). A dubaji robotzsaru, amelyből több százat terveztek munkába állítani, figyelmezteti a törvényt megszegő embereket, segít a keresési és mentési műveletekben. A program egyik felelőse szerint sikeres a kezdeményezés, hogy a metropoliszt ezzel a technológiai újítással biztonságosabbá tegyék.

MI kontra kiberbűnözők

A kiberbűnözés társadalomra veszélyességének intenzív növekedésével, már nem beszélhetünk egy speciális, szektorokat érintő, elzárt jelenségről. Önmagában már maga a mérete is megdöbbentő: szakértői jelentések mintegy 8 trillió dollárra teszik az idén várható károkat, amely csak az elkövetkező három évben 15%-kal nőhet – évente. A zsarolóvírusok okozta kár sem elhanyagolható (2031-ig évente 265 milliárd dollárnyira saccolják), illetve a kriptovalutákkal kapcsolatos visszaélések mértéke is meredeken emelkedik. A vállalati, céges, rosszindulatú vagy állami (kínai, orosz vagy észak-koreai) hackerek adatlopási tevékenysége is a kiberbűnözéshez sorolható, amely az új hidegháború kitörésével nem csillapodó fejfájást fog okozni a nyugati döntéshozóknak.

A mesterséges intelligencia szerencsére ezen a területen is segíthet. Erre most csak egy példát mutatunk, felvillantva, hogy nagyon tág a lehetőségek köre.

A 2020-as évek közepe felé haladva, a kibervédelmi szoftverek, alapvető követelménye a 0-day reagálási képesség, a szervezetre szabott, kiberbiztonsági és IT szakértők által, rendszerbe integrált, mesterséges intelligenciával támogatott veszély érzékelési és elhárítási megoldások használata. A rendszer a nap 24 órában figyel, a szabály-alapú és MI algoritmusok együttesen elvégzik azon kibervédelmi teendőket, amelyeket automatizmusokkal célszerű teljesíteni, a további tevékenységekbe pedig a humán szakértői munkaerő belső szabályozás vagy jogszabályi előírások mentén bevonható.

Egy kép száz szónál többet mond, vájt fülűeknek és érdeklődőknek egyarát csemege az IBM biztonsági architektúrája. (A szakkifejezések egyértelmű megfeleltetése érdekében angol nyelvű az ábra)

A piac és a fogyasztói igények növekedése miatt egyre több izgalmas megoldás érkezik a kiberbiztonsági, MI-alapú rendszerekre. A nagy kérdés az lesz, hogy a másik, a bűnözői oldal vajon hogyan fogja használni a mesterséges intelligenciát? Mi lesz a folytatása a high-tech világban dúló macska-egér játéknak?

Csatlós Béla – Kánai András

Komment a 2023. november 14-i Clementine CONTEXT Konferencia margóján

Iparág: Biztosítás

Már évek óta készültem egy témával, amit előre kitervelt spontán hozzászólásnak álcázva felvethetnék valamelyik conText konferencián. Ez idén sem sikerült, pedig a Nemzetközi Bolyai Év miatt egyben meglepetésszerű, matematikus és nyelvészek közt méltó és illő megemlékezés is lehetett volna a nem-euklideszi abszolút geometria megalkotójáról Bolyai Jánosról, aki 200 éve írta apjának: „a semmiből egy új más világot teremtettem”. De mi köze a világ egyik legnagyobb matematikusának a nyelvi modellekhez? Kevésbé ismert, de Bolyai János próbálkozott egy magyar nyelven alapuló tökéletes mesterséges világnyelv létrehozásával is. Másik aktualitás – a konferencia előtti napon, november 23-án volt a Magyar Nyelv Napja. (Létezik Nemzetközi Anyanyelvi Nap is, február 21-én.) És nyilvánvaló a szakmai aktualitás is egy mesterkélt Al-intelligenciák (sic!) nyelvi vonatkozásait tárgyaló helyzetben.

Élőben a téma felvezetése néhány kérdéssel indulna. Érdemes-e eszperantóul tanulni? És latinul? És angolul? És mi ebben a három nyelvben a közös? Egyre többen jelentkeznének, tudva lévén, hogy ezek mesterséges, holt vagy élő nyelvként világnyelv jelöltek. A következő kérdés volna, vajon hány mesterséges nyelv van, mint például az eszperantó – a programnyelveket itt nem vesszük figyelembe. Legtöbben egyjegyű számra gondolnak, pedig a válasz több mint ezer. Ez meglepően soknak tűnhet, tekintve, hogy a ma ismert mintegy hatezer természetes nyelvből kevesebb, mint négyezret beszélnek, húszezernyi dialektusban.

Íme néhány ismertebb mesterséges nyelv alkotási kísérlet, bár léteznek még régebbiek is:
XII.sz. Rajmundus Llullus – tökéletes nyelv tervezete, az ún. AI atyja, mindentudás generáló szerkezetet is készített.
XVI.sz. Ádám és Éva nyelve – kabbalista kísérlet.
XVII.sz. Leibnitz – ’lingva generális’, az ő jelölésével ismerjük a differenciál és integrálszámítást.
XVIII.sz. Kempelen – nem csak sakkozó, beszélőgépet is épített, erről tudott Bolyai is.
XVIII.sz. Kalmár György nyelvfilozófus, magyar alapú univerzális nyelv alkotása.
XIX.sz. Schleyer – Volapük, ma is létezik pl. volapük nyelvű wikipédia.
XIX.sz. Zamenhof – Eszperantó, ez a legismertebb, több mint 100 országban, több mint 20 millióan is beszélik.
Az újabb törekvésekhez néhány kulcsszó: Interlingva, Euroleng, Robot Interaction Language, stb.

Regényekhez, filmekhez is készültek mesterséges nyelvek, némelyekhez több is, pl.: Startrek-klingon, Stargate -goauld, Starwars-hatt, Avatar-na’vi, Dűne-fremen, Gyűrük ura - sindarin. Tolkien olyan írás jelrendszert is tervezett, melynek betűjelei vizuálisan utalnak az ajak és nyelv aktuális helyzetére, így bármely nem anyanyelvi hang is az írás alapján kiejthető volna. Érdekes, hogy efféle törekvés a régi magyar rovásírásban is megfigyelhető.

Sok mesterséges nyelv témájú internetes oldal van. Sajnos a magyar ’startlap.hu’ tematikus ’mesterseges.lap.hu’ oldalán nincs Bolyai mesterséges nyelvére való utalás. Persze pontosított kereséssel találhatók ilyenek, pl. Marácz László (Amsterdami egyetem) és Fazekas Emese (Kolozsvár Bolyai egyetem) egymástól függetlenül írt cikkei Bolyai mesterséges nyelvéről.

Bolyai János (1802-1860) és apja Bolyai Farkas (1775-1856) Gauss kortársai, Marosvásárhelyiek. Tevékenységük nem korlátozódott a matematikára. Mindketten több nyelvet beszéltek, zenéltek, zeneelméletet is alkottak. Az apa színdarabokat is írt. Cserépkályha építési ötlete ma is Bolyai-féle kályhaként ismert. János jól vívott stb. hosszan lehetne sorolni, mi mindennel foglalkoztak. Tudományos tevékenységeik és az azokat elemző művek mellett szépirodalmi feldolgozások is születtek a tragikus apa-fia és Gauss-szal való viszonyukról, illetve a világtól való meglehetős elszigeteltségük miatti viszontagságaikról. Bolyai Farkas legtöbb könyvét önköltségen, névtelenül adta ki. Bolyai János főműve az abszolút geometriáról 1832-ben, apja Tentamen című matematika könyvének függelékeként jelenhetett meg, ezért ismert „Appendix” néven. Méltó elismerést Gauss helyett először csak jóval halála után, olasz matematikusoknak köszönhetően kapott. A Bolyaiak hatása eleinte az utókorra sajnos csekély, aminek oka elszigeteltségük, és Bolyai János esetében publikálatlanság is. Hagyatékuk viszont hasznos és érdekes kultúrantropológiai szempontból is a kor szellemi áramlatainak terjedése és hatásainak tanulmányozása végett.

Bolyai János könyvtárnyi kéziratot hagyott maga után, ami még mindig nincs teljesen feldolgozva. Mesterséges világnyelvi kísérletét az Üdvtan című főművének szánt könyve nulladik fejezetének tervezte. „Üdvtan: 0-Nyölv, 1-Nyitan, 2-Széptan, 3-Jótan”. Mindezt magyarul írta, nem lett kész, magyar, német és latin nyelven kívánta volna kiadni.

Bolyai János tök’élyes mesterséges nyelvéről, főleg a korábban hivatkozott Marácz és Fazekas cikkek alapján

Bolyai Jánost eleinte apja könyvei inspirálták, hogy tudományos gondolatokat magyarul is ki lehet fejezni. 1830-ban az MTA, de korábban más európai nemzeti tudós társaságok is elsősorban a tudományok saját nyelven történő művelésére alakultak. Bolyai Farkas főleg szakszavakat alkotott, amelyek szándéka szerint szemléletesen fejezik ki a jelentést. Az 1934-ben megjelent szakszótár 145 címszava tőle származik, némelyik ma is használatos. Szerinte a latinnal összehasonlítható egyetemes nyelvre lenne szükség, a gyarapodó tudományos eredmények feldolgozása miatt. Bolyai János továbbment, a magyar nyelv minden kivételtől és többértelműségtől való megtisztítására törekedett. A nyelvi gazdagság az ő szemében maga a tökéletlenség (sic!), éppen emiatt is kell megtisztítani. Mindezt nem azért, mintha a magyar nem volna eléggé kiművelt, hanem a nyelv tanulmányozása nélkül tudományos írás lehetetlen. Másik és legfőbb célja, nem csak a nemzetek kommunikációja, hanem szerinte a közös nyelv erkölcsi magasságot, örök békét és eszményi államot biztosít.

Bolyai János 1842-től apja ötletei nyomán kezdte az általa tökélyes nyelvnek nevezett világnyelv kidolgozását. Fő törekvése a nyelv egyértelműsítése volt. A világnyelv érdekében a nyelvet először a gyökszavakig teljesen le kell bontani, hogy aztán tökéletes nyelvként lehessen felépíteni, akár azon az áron, hogy a nem egyértelmű gyökszavakat más nyelvből származó, vagy akár önkényesen kreált gyökszó helyettesítse. Ehhez felhasználta többek közt apja háziorvosa, Engel József akadémia gyökpályázatra készített 1939-es gyökszótárát. Az ún. gyökszavak a XIX.sz-ban váltak tudatossá. Bolyai János szerint a magyar primagene nyelv, ami önmagából keletkezett, gyökszavai nem vezethetők tovább.

Pl.: A tökélyes szót a tök szóra vezeti vissza, ebből lett a tök’élyes (érdekes ehhez képest a manapság elterjedt „tök jó” kifejezés). A seb ’sebesség’ szó gyöke miatt, a söb szó legyen a sebesülés eredeti seb gyöke helyett. Cédula gyöke lenne céd, hiába eredete a latin schedula, stb.

Bolyai János a „három hang hipotézisét” is magáévá tette, miszerint a magyar gyökszavak legfeljebb három hangból állnak. Új abc-t is tervezett latin betűkkel, egy hang egy jel alapon, de az eredeti betűket esetleg kiegészítve ékezettel, alul felül vonással, vagy benne ponttal stb. A nyelvet pusztán a jelek tudománya, a szemiotika részének tekintette, ami kevesebb jellel egyszerűbb és egyértelműbb lehetne. Szerinte a legősibb nyelv egyértelmű, „algebrai” nyelv volt, de „irodalmárok, költők elrontották”. Az ősi nyelvet héber szójátékkal „géber” nyelvnek nevezte. Világnyelvi javaslata összehasonlítható pl. az olasz matematikus Peano „Latino sine flexione’ egyszerűsített latinjával is, amely szintén a-posteori, azaz már létező nyelvből származó.

Bolyai János írásaiban rendkívül terjedelmesen értekezik a magyar nyelv különleges értékeiről, melyekben igazolva látja a magyar nyelv és nyelvtan legalkalmasabb választását a világnyelv alapjául. Helyszűkében ezek részletezése helyett, legyen itt legalább egy a lelkesedését és sajátos patetikus stílusát is szemléltető részlet: „a magyar nyelv legbelső, eredeti – de tudtomra, sőt hitem szerént, a földön még mind eddig, ki nem fejlett – szellemére nézve ugyan ép, ki-tűnő derék, józan tapintatú, szerencsés választású, egyszerű s gyönyörű, sőt általjában tökélyes, igazi philosophusi és éppen mathesisi szellemű, s Őseink lángeszére mutató, azt bizonyító.”

Gondolatok Bolyai János nyelv tervezetéről

Megállapítható, hogy Bolyai János terve többféleképpen is utópisztikusan naiv – világnyelv nem hoz világbékét, élő nyelv nem környezet-függetleníthető. Minden élő nyelv viszontagságai nem egyesíthetők egy közös nyelvben. Az írásjelek egyszerűsítése is nehezebb, hiszen világszerte több mint hatszáz féle hangot képeznek a különböző anyanyelveken, de mindenki csak a saját anyanyelvében szereplőket tudja kiejteni, mert az agy korán leszokik a többi hangnak nem csak a képzéséről, de az érzékeléséről, illetve megkülönböztetéséről is!

Viszont Bolyai János naivitására többféle mentség is felhozható, azon kívül, hogy kora európai nemzeti romantikus áramlatai erősen hatottak rá. Számos megállapítását azóta nyelvészek is alátámasztották. Sikertelensége mellett próbálkozása tanulságos, különösen pl. az AI nyelvmodellek fejlesztői számára. Nyelvi naivitása sok hasonlóságot mutat az AI-hype felelőtlen és meggondolatlan szólamaival, ami miatt a naiv szemlélő pl. a chatgpt láttán egyik csodálatból a másik csalódásba esik.

Bolyai geometriai és mesterséges nyelvi munkái egymáshoz hasonló gondolkodási stratégiát tükröznek. Pontosabban: a geometriában megszabadulni a „paralellák problémájától”, a nyelvben pedig a „környezeti paralelláktól”, majd újból építkezni azok nélkül. Tehát új geometriai világa mégsem a semmiből való, hanem a-posteori, mint ahogyan új nyelve is. A nyelv újra felépítése által a nyelvet pusztán nyelvtani szabályokkal automatikusan értelmezhetővé kívánta tenni. Sajnos-szerencsére ez nem sikerült. Kicsit olyan ez, mint Pythagoras esete a természetes számokkal kifejezhető arányokkal, kiderült, hogy létezik, sőt sokkal több a természetes számokkal nem kifejezhető arány (irracionális számok). Mint ahogyan az élő nyelv is sokkal többféle gondolatot kifejezhet, mint ami racionálisan kifejezhető.

Bolyai egy a programozókat is gyakran megtévesztő illúzió áldozata, ugyanis abból, hogy bizonyos emberileg nehéznek tűnő folyamat sokszor könnyen algoritmizálható, nem következik, hogy emberileg könnyebbnek tűnő dolgokat még könnyebb algoritmizálni. Sőt, többnyire fordítva van: ami az embernek nehéz, az lehet könnyebb a gépnek, és ami a gépnek nehéz, az lehet könnyebb az embernek.

Szerencse viszont, hogy Bolyai János számára a „paralellák problémája” nélküli geometria nem tűnt utópiának, mint sok kortársa és apja vélték, ezért azt mégis megvalósította. Még nagyobb szerencse, hogy előbb az abszolút geometriával kezdte. Nyelvi kísérlete viszont örökké tarthatott volna. A magyar nyelv nemzetközileg is legendásan bonyolult. Egy régi vicc is erre utal, melyet a pápa is idézett Magyarországról távozóban a reptéren: „Milyen nyelven beszélnek a mennyországban? – Magyarul. – Miért? – Mert egy örökkévalóság megtanulni.” Bolyai János legfőbb szándéka volt „tökélyes világnyelvével” még életében a mennyei boldogságot megvalósítani itt a földön: „… néhány óra alatt megtanulható a tökélyes magyar nyelv és annak következtében, az által értelmi és erkölcsi egyet értés, az eddigi csaknem köz-gyűlölség helyett, köz, nemcsak fele-, hanem egész baráti szeretetre ragadtatás eszközlése, valósítása, létesítése,örökös béke, mennyei paradicsom s bármily s mely nép fogalma szerénti vágyja Bolyai Jánostól és által.”(Bolyai János)

Könyves Tóth Előd
Ps.: A Clementine Láncreakció Podcast 2023.dec.2. #136. „Matekos mémek magyar módra” című adásából fájdalmasan hiányzik Bolyai János nem-euklideszi abszolút geometriája.

KORONAVÍRUS - TÁJÉKOZTATÓ

Iparág: Biztosítás

Tisztelt Partnerünk!

A koronavírus kapcsán kialakult egészségügyi helyzet minden cégtől és munkatárstól kiemelt óvatosságot és megfontoltságot kíván. Mi, a Clementine-nál hiszünk az egyén társadalom iránti felelősségvállalásában, támogatjuk a vírus megfékezéséhez, izolációjához vezető legegyszerűbb eszközt, az otthon maradást.

A következő időszakban legtöbb munkatársunk otthonról dolgozik, csak kivételes esetben tartunk személyes találkozót, hiszen feladatainkat zökkenőmentesen tudjuk végezni távolról is.
Továbbra is örömmel állunk Partnereink rendelkezésre az online csatornák bármely platformján!

Ezúton kívánunk minden kedves munkatársunknak, partnerünknek és ügyfelünknek jó egészséget és eredményes otthoni munkavégzést!

Clementine

Közeleg-e a tél az MI-ben? Vagy, mint a podcast-ban: MI- tél helyett MI-nyár lett 2022-ben – de mi is az az MI-tél?

Iparág: Biztosítás

A stateof.ai minden évben elkészülő gigantikus évösszegzője alapján a Láncreakció podcast-ban kollégáink áttekintették mi minden történt tavaly a mesterséges intelligencia háza táján. Megelőzte-e Kína az USA-t, merre mennek tovább a nyelvi, hol szivárognak az adatok a tudományos kutatásban, mennyi idő alatt jelennek meg az új eredmények open source változatban?
Az adásban felmerült, hogy az elmúlt években sok jóslat szólt egy közelgő MI-télről. Ennek apropóján következő cikkünkben arra vállalkozunk, hogy összefoglaljuk a mesterséges intelligencia történetének váltakozó időszakait.

Közeleg-e a tél az MI-ben? Vagy, mint a podcast-ban: MI- tél helyett MI-nyár lett 2022-ben – de mi is az az MI-tél?

Sokatmondó tény, hogy ez a beszélgetés és a következő cikk máshogy nézett volna ki két évvel ezelőtt. Még máshogy 10 vagy 15 éve, amikor még előttünk állt a sok, ma már mindennapinak tűnő csoda: a neurális hálózatok használata, a rendkívül okos algoritmusok, a felhőbe költözött számítási kapacitás megléte. Amikor tehát MI-télről, vagy „AI Winter”-ről beszélünk, ezt most egy „AI Summer” felé tartó vonaton tesszük – legalábbis az MI befolyásos hangadói, orgánumai sokkal derűlátóbbak most, mint évtizedekkel ezelőtt.

Miért lett tél?

AI Winter, vagyis a mesterséges intelligenciával kapcsolatos kutatások befagyása, a terület egyhelyben topogása. Ezzel az angol kifejezéssel írták le, hogy az 1950-es évek derekán létrejövő kutatások hogyan álltak le később, miképp mentek tévútra, és milyen nehézségek keresztezték a mérnökök, informatikai szakemberek útját.

Akkoriban két egymással összefüggő folyamat hozta el a „telet”. Az 1970-es években járunk, amikor is a DARPA (Defense Advanced Research Projects Agency), vagyis az Egyesült Államok Védelmi Minisztériumának kutatásokért felelős részlegének vezetésében változás állt be. Az új döntéshozók nem voltak eleve ellenségesek az MI-kutatások finanszírozásával szemben, hanem az addig rendelkezésre állt büdzsét az MI mellett más kutatásokra, például a szuperszámítógépek területére is meg akarták osztani.

Az angolszász világban történt még egy negatív esemény. Nagy-Britannia Tudományos Kutatási Tanácsa ugyanis felkérte a nagy tekintélynek örvendő James Lighthillt, hogy írjon egy beszámolót a mesterséges intelligencia jelenlegi helyzetéről, előrehaladásáról. A szakember igen kritikusan úgy fogalmazott írásában, hogy az MI semelyik területén nem ért el a szakma olyan felfedezéseket, amelyek a megígért hatással jártak volna. Ez a megállapítás az amerikai finanszírozás megvonása mellett lavinaként söpört végig az európai egyetemek során, és elvezetett a kutatási péntek elapadásához. Ez a becslések szerint 5-10 évre lelassította a kutatásokban kulcsszerepet betöltő egyetemi kutatók, laborok és közösségek munkáját. A nyolcvanas években a közvéleményt és a befektetőket is más izgatta: a rendkívül gyorsan fejlődő személyi számítógépek elterjedése, piaca, a benne lévő lehetőségek kiaknázása. Bár az 1980-as években az üzleti életben megjelentek a logikai következtetésre képes úgynevezett szakértői rendszerek, maga a szakma sem tartotta ezeket igazi MI-megoldásoknak. A lelkesedés, a befektetés megint csökkenni kezdett, és 1988-ra a második „tél” is beköszöntött.

A remények évszakai

Látható, hogy az MI fejlődését nagymértékben meghatározta a belé vetett hit. A hype-ot mindig kijózanodás és korrigálás kísérte. Így például, amikor 1997-ben az IBM Deep Blue sakkszámítógépe legyőzte a legendás sakknagymestert és -világbajnokot, Garry Kaszparovot, a szalagcímek már az emberi elme uralmának végnapjait harsogták. Mégis, visszatekintve, „csak” egy olyan MI-t kaptunk, amely egyetlen egy területen győzte le az embert (ráadásul a sakkszakértők szerint Kaszparov olyan negatív lelkiállapotba hozta magát a mérkőzéssorozat folyamán, amely nem volt rá jellemző). A Deep Blue-ból semmi nem következett, nem épült be a mindennapokba, nem nyújtott gazdasági megoldást napi problémákra.

Az 1990-es évek vakító reménysugarai elé három óriási árnyék vetült: híján voltunk hihetetlen gyorsaságú, teljesítményű számítógépeknek, nem állt rendelkezésre elegendő memória, és az adatok tömkelege sem volt elérhető. Hiába ismertük az 1950-es évek óta a neurális háló gondolatát (és korai megvalósulását), a telet akkor sem tudta elkerülni a szakma. Jellemző adat, hogy míg 1986-ban csaknem hatezren vettek részt a szakági konferenciákon, ez a szám 2000-re csökkent 1991-re, és a mesterséges intelligenciával foglalkozó cikkek száma 1995-re a legalacsonyabbra apadt.

Áttörés, tavasz

A 2010-es évek elején a Big Techben felhalmozódott hihetetlen tőke, az invesztíciók, a felvett, egyre nagyobb számú szakemberek tudása, a technológiai háttér Moore-törvényeknek engedelmeskedő fejlődése tette lehetővé a mélytanulási módszerek finomodását, a korábbi problémák leküzdését, amellyel egy sor alkalmazás létrehozása előtt nyílt meg az út: önvezető autók, robotok, nagy nyelvi rendszerek, és persze legújabban az emberiséget lázban tartó ChatGPT és a text-to-picture rendszerek.

Éppen ezért ma szinte senki nem beszél „AI Winter” -ről. Persze, most is fel lehet fedezni azokat a hangokat, amelyek figyelmeztetnek: ez mind szép és jó, de az igazi MI-től, az általános, széles tudású rendszertől messze vagyunk még! Nehogy belelovaljuk magunkat abba a hibába, mint korábban: nagy reményeink lettek, majd elporladtak a realitás nyers viszonyai között.

Csak néhány leküzdendő probléma: az általánosítás lehetetlensége (mi, emberek, egyik tapasztalatunkat könnyen át tudjuk vinni egy másikra, a mélytanulási algoritmusok nem), a találékonyság és kreativitás, kontextus értelmezése (azaz a gép nem tudja eldönteni, hogy egy alkotás szép-e, egy üzleti ötlet mennyire életszerű). A neurális hálóra, mélytanulásra épülő módszerek keltette izgalomhullámok lecsendesülése, a sokak által készpénznek vett ígéretek be nem teljesülése hozhatja el a következő telet – hacsak a felhasználókat és a cégeket ez hidegen hagyja, mivel egy gombnyomásra, elfogadható havidíj mellett generálják maguknak az újabb és újabb tartalmakat.

Ha ez utóbbi elterjed, akkor a befektetők is a gyors megtérülést részesítik majd előnyben, nem az egyetemi és céges kutatások sokszor évekig tartó, sok nyűggel járó folyamatát.
Hallgasd meg a Láncreakció podcast kapcsolódó adását is!

Küszöbön áll-e az AGI (az általános célú mesterséges intelligencia) megjelenése?

Iparág: Biztosítás

Ez a nagy kérdés, és ez minden, MI-vel kapcsolatos filozofálgatás ősatyja. A válasz nem egyszerű, és mint látni fogjuk, maguk a szakma világszerte legelismertebb kutatói, követők ezreivel rendelkező szakemberei sem egyeznek meg ebben a kérdésben. Ez a cikkünk pillanatképp arról, hogy az általunk szubjektívan kiválasztott MI-hozzáértők mit gondolnak: vajon a közelben döngenek-e már Terminátor súlyos léptei, vagy a derűlátóbbak reménykedhetnek-e az utópisztikus elképzelések gyors megvalósulásában?

Csak ne olyan hevesen

Két Princetonban tanuló PhD hallgató, Arvin Narayanan és Sayash Kapoor 2024 decemberében az amerikaiakra jellemző elfogult tudatlanságot ostorozta. Ennek hátterében az a jelenség áll, hogy a nagyközönség az úgynevezett „bennfentesek” optimista előrejelzéseit kritikátlanul elfogadja. A két szerző leírta, hogy a nagy nyelvi modellek skálázási problémákkal küzdenek (magyarán lassan elfogy a használható adatkészlet, és/vagy a nagyobb paraméter nem feltétlenül jelent jobb nyelvi modellt). A cikkük címében feltett kérdésre, hogy „lassul-e az AI fejlesztése?” kitérő választ adnak maguk is. A határozott IGEN hiánya viszont egyértelműsíti, hogy az AGI szerintük még távoli lehetőség. Írásuk nagy visszhangot vert MI-körökben.

AGI mint közeli végcél

Ilya Sutskever, a legendás kutató 2024 májusában hagyta ott az OpenAI-t, hogy – azóta közel egymilliárd dollár tőke bevonásával – megalapítsa az SSI-t, vagyis a Safe Superintelligence Inc.-et. A 2024 júniusában publikált manifesztója szerint a szuperintelligencia elérhető távolságban van. Az ő és társai célja azóta nem az, hogy meggyőzze az embereket a szuperintelligencia elkerülhetetlen megjelenéséről, hanem hogy az új entitás biztonságos legyen. Ahogy írta az egyik posztjában: „hogy az AGI úgy szeresse az embereket, ahogy a szülők a gyermekeiket.”

A CEO-k becslései

Az OpenAI igazgatója, Sam Altman egy tavalyi megjegyzése szerint „néhány ezer napra vagyunk” az AGI-tól, míg a sokak szerint legjobb LLM-terméket, a Claude-ot fejlesztő Anthropic vezetője, Dario Amodei ezt közelebbre teszi, 2026/7-re. Nyilvánvaló, hogy ők a befektetőik felé (is) kommunikálnak, de az ilyen kijelentésekkel saját reputációjukat/hírnevüket is kockára tehetik.

Az utóbbi hetekben, különösen az OpenAI logikai érvelésre és értelmezésre képes modellje, az o3 decemberi megjelenése után az OpenAI néhány munkatársa sokkal erősebben kezdte el verni az AGI hájpdobját. Közéjük tartozik Vahid Kazemi is, aki nemes egyszerűséggel ezt írta: „Véleményem szerint már elértük az AGI-t, és ez még egyértelműbb az o1-nél. Nem értünk el <<jobbat, mint bármely ember bármely feladatban>>, de amink van, az „a legtöbb feladat teljesítésében jobb, mint a legtöbb ember”.

Az USA-ban, a technológiai szektor magasabb szintjein uralkodó, lassan általánosan elterjedt nézetet jól illusztrálja Michael Dell egy posztja. A Dell Technologies világhírű alapítója szerint a „szuperintelligencia felé tartunk”, erre pedig Logan Kilpatrick, a legújabb Alphabet-modelleket ingyen elérhetővé tevő Google Ai Studio vezetője csak annyit válaszolt: „Korrekt.” Ugyancsak az utóbbi szakember azt írta egy álláshirdetésben: „Gyere hozzánk AGI-t építeni!”

Csak ne olyan hevesen, 2. felvonás

Gary Marcus, amerikai kognitív tudós, neuro- és MI-kutató, többszörös MI-startupalapító több kételyt is megfogalmaz az AGI közeli eljövetelével kapcsolatban. Először is a jelenlegi nagy nyelvi modellek (LLM-ek), mint például a GPT-4 képességeit és korlátait ostorozza, különös tekintettel a megértés és a világ modellezésének hiányára. Szerinte az LLM-ek nem "értenek", csak mintákat ismernek fel és reprodukálnak, anélkül, hogy valódi kognitív folyamatok zajlanának le bennük. Nem rendelkeznek belső modellel a világról.

Marcus szerint a valós világ tele van váratlan helyzetekkel és összetett összefüggésekkel, amelyek megértéséhez az LLM-ek jelenlegi módszerei nem elegendőek. Elutasítja azt a nézetet, hogy a modellek egyszerűen méretbeli növelésével a megértés is megjelenik. Szerinte az LLM-ek alapvető korlátai strukturálisak, és nem pusztán a számítási kapacitás hiányából adódnak.

Gary Marcus szerint mindezek fényében szükség van egy radikálisan más megközelítésre a mesterséges intelligencia fejlesztésében. Olyan kutatások kellenek, amelyek a megértés, a reprezentáció és a következtetés mélyebb megértésére fókuszálnak, és nem csak a mintázatfelismerésre – ő a szimbolikus MI-t és a hibrid megközelítéseket említi alternatívaként.

De most, állítja a szakember, a szingularitás és az általános célú mesterséges intelligencia még jó messze van.

Küszöbön az MI összeurópai szabályozása

Iparág: Biztosítás

Amerika innovál, Európa szabályoz – a közkeletű és kissé szigorú vélemény mostanában többször megfogalmazódott, leginkább az AI Act kapcsán. Az Európai Uniónak a mesterséges intelligencia használatáról szóló szabályozása 2021 áprilisában lett publikus. Bár a jogszabály még az elfogadási folyamatban tart és az Európai Tanács az utolsó ellenőrzéseket végzi, iparági szakértők szerint nagyon fontos szöveg született.

Az AI Act célja

Az angol nyelvű szöveg közel 500 oldalon tárgyalja a többek közt a generatív MI által felhozott problémákra adandó európai válaszokat. Emiatt ez a cikk csak e leglényegesebb pontjait tudja bemutatni, hozzátéve, hogy a jogszabály szakmai értékelése még nem fejeződött be.

A javaslat célja, hogy egységes jogi keretrendszert hozzon létre az EU-ban a jelenlegi töredezett szabályozás helyett. Természetesen fontos az emberek alapvető jogainak és szabadságainak védelme az MI-alkalmazások által jelentett kockázatokkal szemben, miközben jogbiztonságot és kiszámíthatóságot szeretne teremteni a fejlesztők és alkalmazók számára. Nem utolsósorban (Lásd a cikk elején az idézett mondatot!) az AI Act támogatni kívánja az EU innovációs és gazdasági fejlődését azzal, hogy egységes piacot hoz létre az MI-termékekre és -szolgáltatásokra.

Kockázatok és mellékhatások

A fenti, nemes és jól csengő célokat kockázat alapú megközelítésben tárgyalja a tervezet. Négy kategóriába sorolja az MI-rendszereket a fogyasztóra és a társadalomra való kockázatuk alapján:

Elfogadhatatlan kockázat: tilos az olyan MI-alkalmazások használata, amelyek manipulálják az embereket tudatalatti technikákkal vagy kihasználják a kiszolgáltatott csoportokat (pl. gyerekeket), továbbá az ún. social scoring rendszerek alkalmazása hatósági döntésekhez, erre negatív példa a kínai gyakorlat.
Magas kockázat: idetartoznak pl. a munkaerő toborzásra, hitelminősítésre, kritikus infrastruktúrák üzemeltetésére használt, vagy a bűnüldözésben, igazságszolgáltatásban alkalmazott MI-rendszerek. Ezekre részletes kötelezettségek vonatkoznak:
- Kockázatértékelés és -kezelés,
- Magas szintű adatminőség és governance,
- Emberi felügyelet, beavatkozás lehetősége,
- Nyomon követhetőség és dokumentáció,
- Átláthatóság és tájékoztatás a felhasználók felé,
- Kiberbiztonság,
- Megfelelőségértékelés forgalomba hozatal előtt.
Alacsony kockázat: a legtöbb MI-alkalmazás ide fog tartozni (pl. chatbotok, videojátékok MI-je). Rájuk kevés kötelező előírás vonatkozik, de önkéntes magatartási kódexek betartása ajánlott lesz.
Minimális kockázat: a tisztán személyes használatú vagy kisegítő jellegű MI-rendszerek (pl. spamszűrők) szinte semmilyen speciális szabályozás alá nem fognak esni, csak az általános fogyasztóvédelmi, termékbiztonsági követelményeknek kell megfelelniük.

Mit várnak a törvényalkotók a szabályozástól?

Elsősorban a fogyasztók és állampolgárok védelme erősödhet az MI káros hatásaival szemben, különösen a magas kockázatú MI-rendszerek veszélyét illetően.

A bizalom növekedését várják az MI-technológiák iránt, hiszen garanciák lesznek a biztonságos és etikus működésükre. Ez ösztönzi az MI szélesebb körű elfogadását és használatát.

Az egységes EU-s szabályozás csökkenti a jogi bizonytalanságot és a megfelelési költségeket az MI-fejlesztők és -alkalmazók számára. Ez kedvez az innovációnak és beruházásoknak Európában.

A magas szintű EU-s elvárások igazodási pontként szolgálhatnak a globális sztenderdek kialakításához, így az EU vezető szerepet játszhat a felelős MI nemzetközi szabályainak formálásában.

A speciális támogatási eszközök, mint a regulatory sandboxok segítik a cégeket az AI Act követelményeinek való megfelelésben és az innovatív MI-megoldások kikísérletezésében kontrollált körülmények között.

Aggályok

Szakértők egy csoportja negatívumokat is megfogalmazott az AI Act-ról. Ezek egy része a kidolgozatlanságot említi, például a biometrikus azonosítás vagy az érzelemfelismerés terén. Emellett a magas küszöbértékek az általános célú alapmodellek tekintetében azt eredményezhetik, hogy számos nagy hatású modell kimarad a szigorúbb követelmények alól.

Valószínűleg az innováció védelme, segítése és a reguláció viszonya fogja eldönteni, hogy a gyakorlatban hogyan válik be a törvény, ha európai jogerőre emelkedik.

Az AI Act egy differenciált és átfogó szabályrendszert vezet be a világon először egy nagyobb gazdasági térség számára. Végrehajtásáért és a felügyeletéért elsősorban a tagállami hatóságok lesznek felelősek, miközben a Bizottság javaslata szerint létre fog jönni egy Európai MI-testület is a tagállami szervek munkájának koordinálására, iránymutatások kiadására. A szabályok megsértése esetén a kiszabható bírságok a globális árbevétel 2-6%-át is elérhetik, vagy 30 millió euróra rúghatnak – tehát az AI Act mindenképpen kőkemény gazdasági kérdést is jelent.

A többi MI-nagyhatalom (USA, Kína) egyelőre nem rendelkezik hasonló jogszabállyal.

A témáról a dataSTREAM 2024 konferencián bővebben is hallhatunk Horváth Katalin, a CMS Budapest Ügyvédi Iroda partnerének előadásában.

Lecsap a Llama: a nyílt forráskódú MI-modellek térhódítása

Iparág: Biztosítás

ChatGPT, Claude, Gemini– ezek már minden, mesterséges intelligencia iránt fogékony háztartásban (cégben) ismerős nevek. Az úgynevezett nagy nyelvi modellek mellett azonban szinte mozgalomszerűen megjelentek a nyílt forráskódú rendszerek, amelyek helyet követelnek maguknak a Nap alatt. A cikkben röviden összefoglaljuk, hogy miért.

Okosak és sokba kerülnek

A ChatGPT jött, látott és győzött. A mai napig legismertebb – és számos benchmarkban legjobban teljesítő – chatbot e cikk írása előtt mutatta be O(mni) kódnevű változatát, amely újabb varázslatos képességekről tett tanúbizonyságot a céges demókban. Természetesen a Birodalom is visszavágott: az Alphabet Geminije pár nappal később látványos prezentációban indokolta meg, hogy a keresőóriás anyavállalata komolyan gondolja a piaci harcot. Kettejük küzdelme mellett ott van még (nevető) harmadikként az Anthropic cég Claude modellje, amelyet sokan az egyik legintelligensebb, hosszabb szövegek létrehozására legalkalmasabb versenyzőnek tartanak.

A gond azonban az, hogy ezek egyrészt nagyon drága, erőforrás- és energiaigényes eszközök (a Stanford számítása szerint csak a Gemini Ultra betanítása 190 millió dollárba került). Ezen kívül a cégek hogyan tudnák a legjobban kiaknázni a saját adatkészletükben rejlő potenciált, ha egy másik vállalat a szolgáltatójuk?

Itt lépnek a képbe a nyílt forráskódú nagy nyelvi rendszerek.

Nyílt: kisebb és kompaktabb

A „nyílt” ebben az esetben a kódra, az adatstruktúrára és a kiképzésükre vonatkozik: ellentétben például a ChatGPT-vel, előbbiek esetében pontosan tudjuk, hogyan történt a betanítás. Így könnyen „beleláthatnak” a kutatók, és továbbfejleszthetik a rendszereket, miközben az adatlopás gyanúja fel sem merül. (Az informatikában egyébként régi jelenség a nyílt fejlesztés, ennek gyümölcsét mindenki élvezheti, aki például a Firefoxot, a közösség által egyre jobbá tett böngészőt használja.)

Tegyük fel, hogy egy cég saját, intelligens chatbotot szeretne fejleszteni! Választhatja a ChatGPT API-ját, hogy ahhoz kapcsolódva hozzon létre egy újat magának, de ebben az esetben két területen is problémába ütközik. Először is, korlátozott a testre szabási lehetősége, másodszor pedig továbbra sem tudja, milyen adatkészleten okosították fel az algoritmust. Egy nyílt forráskódú nagy nyelvi rendszernél mindezek a kifogások eltűnnek. Emellett azonban nem elhanyagolható az adatbiztonság kérdése sem, hiszen a más cég felhőjének használata biztonsági okokból nem minden cég, nem minden munkafolyamatában megengedett, míg a nyílt változatnál – épp a testre szabhatóság miatt – ez könnyebben megoldható.

A nyílt rendszerek cégen belüli „megépítése” egyszerűbb és olcsóbb mutatvány, mintha valamelyik techóriás fizetős változatát választanák. Ha ezt összekötik a RAG-technológiával (Retrieval Augmented Generation), akkor a cég védett, naprakész adataival történik a betanítás, és ez még pontosabb működést eredményez. Gondoljuk el, hogy ez a tény milyen előnyt jelent például egy saját, ügyfélszolgálati MI-rendszert fejlesztő vállalat esetében!

A további nyilvánvaló és érzékelhető előny, hogy sokkal kisebb, ezáltal gyorsabb, specifikusabb és fenntarthatóbb modellek jönnek létre, sőt, a működtetésükhöz is kevesebb szakember kell, mint a nagy testvéreikhez.

A Meta válasza a Microsoftnak és az Alphabetnek

A betanítható adatok kincsestárán csücsülő Meta (leánykori neve: Facebook) maga is a nyílt – és természetesen a közösségi hálózataiba beépíthető – nyelvi rendszer mellett tette le a voksát. A Llama-sorozat harmadik változatát 2024 áprilisában publikálták, és az elemzőket lenyűgözte a modell teljesítménye. A 15 trillió (!) tokenen betanított Meta-termék képességei sok esetben alig maradnak el a legújabb ChatGPT-től (természetesen számít, hogy milyen feladatra használják).

A Llama mellett megjegyzendő további nevek az IBM Granite-ja, a Microsoft saját Phi-3-ja, de mi különösen örülhetünk a Mixtral 8x7B-nek – ez utóbbiban végre egy európai nyílt nyelvi rendszert üdvözölhetünk. A francia cég terméke jelenleg szinte a legjobb ár-érték arányt kínálja, és további olajat locsol a nyílt nagy nyelvi rendszerek egyre magasabbra csapó lángjaira. A szinte mozgalomszerű lelkesedés érthető: az OpenAI, amely a nevével ellentétben nagyon is zárt, egyre jobb versenytársakat kap, így végső soron mi, a fogyasztók csak nyerünk a helyzeten.

Végül meg kell említenünk, hogy már most látszik egy mindenki számára érthető használati mód: kis méretüknél fogva a nyílt rendszerek némelyike akár egy saját laptopon, sőt mobiltelefonon, internetkapcsolat és felhő nélkül is futtatható. Ezzel a generatív mesterséges intelligencia még közelebb került ahhoz, hogy olyan mindennapi informatikai eszközzé váljon, mint például a levelezőprogram vagy egy Word.

Létrejött a Mesterséges Intelligencia Koalíció

Iparág: Biztosítás

Palkovics László innovációs és technológiai miniszter kezdeményezésére a Digitális Jólét Program (DJP) keretében idén októberben alakult meg az MI Koalíció. Mostanáig összesen 124 nagyvállalat, hazai KKV és startup vállalkozás, egyetemi és tudományos kutatóműhely, szakmai és közigazgatási szervezet csatlakozott alapítóként az MI Koalícióhoz, köztük a Clementine is. Az MI Koalíció továbbra is nyitott, így bárki benyújthatja csatlakozási kérelmét.

A mesterséges intelligencia korunk egyik legnagyobb hatású technológiai újdonsága, amely a vállalati folyamatok hatékonyságának radikális javítása mellett olyan területeken is áttörést hozhat, mint az egészségmegőrzés vagy az önvezető autók. Ma még felmérhetetlen hatásai miatt sokan az elektromosság vagy az internet megjelenéséhez hasonlítják az MI jelentőségét.

Ezt felismerve kezdeményezte az innovációs és technológiai miniszter a MI Koalíció létrehozását annak érdekében, hogy a globális vállalkozásoktól a hazai startupokig, a szakmai szervezetektől az egyetemi műhelyekig, a kutatói szférától a közigazgatásig a lehető legszélesebb körű együttműködés jöhessen létre. A koalíció céljai között a magyar vállalkozások és a nemzetgazdaság versenyképességének növelése éppen olyan fontos elemként szerepel, mint a szabályozási és etikai kérdések megvitatása.

A Digitális Jólét Program (DJP) által működtetett MI Koalíció állandó szakmai és együttműködési fórumot biztosít az MI-fejlesztők, a felhasználói oldalt képviselő piaci és állami szereplők, az akadémiai és szakmai szervezetek között. Kiemelt törekvése Magyarország MI stratégiájának kidolgozása, amelynek segítségével kedvező gazdasági és szabályozási környezet teremthető az MI alapú technológiafejlesztéshez és annak eredményes alkalmazásához. Meghatározó cél továbbá, hogy az MI alapú fejlesztések széleskörű elterjedésének és használatának köszönhetően jelentősen erősödjön a hazai vállalkozások versenyképessége, a magyar startupok és KKV-k egyre növekvő arányban vegyenek részt MI fejlesztésekben, akár nagyvállalati, egyetemi vagy nemzetközi partnerségekben.
Az MI Koalíció november végén tartja első plenáris ülését, amelyen a tagok megválasztják az elnökséget és megalakítják a munkacsoportokat. Az alapító tagok listája és további információk az MI Koalícióról itt érhetőek el.

Még okosabb áruházak

Iparág: Biztosítás

Talán egyetlen terület sem érdeklődik oly intenzíven a mesterséges intelligencia iránt, mint a kereskedelem, a retail világa. Ez persze érthető: itt az okos üzleti döntés azonnali bevételnövekedést, a fogyasztók számának emelkedését jelentheti. Cikkünkben vázlatosan, két példán mutatjuk be, hol tart az iparág az MI (mesterséges intelligencia) alkalmazásában.

Kezdetben volt az ajánlómotor

A világ egyik legnagyobb, online megszervezett piactere, az amerikai Amazon már a 2000-es évek elején rendelkezett saját ajánlómotorral. A több paraméter – például lokáció, legutóbbi vásárlások és keresések, mentett elemek vagy listák, más ügyfelek hasonló keresései vagy vásárlásai – alapján működő rendszer rendkívül fontos volt a cég felfutása szempontjából. Ma már, a ChatGPT korából visszanézve magától értetődőnek tűnik az efféle személyre szabás, de akkor, jó pár évvel az okostelefonok elterjedése előtt ez igazi újdonságnak számított.

Az ajánlás tulajdonképpen olyan volt, mint egy régi barát, vagy valamikor a videotékás, aki bátran ajánlott új filmet a visszatérő vevőnek, miután megismerte az ízlését. Ezt természetesen a mesterséges intelligencia alkalmazása tette lehetővé. Egyes iparági adatok szerint az Amazon bevételeinek így mintegy 35%-a az ajánlott termékeken keresztül folyik be.

Igaz vagy hamis?

Gyors ugrás a 21. század elejéről a 2020-as évek első felére, amikor az Amazon az újabb kihívásokra újabb MI-megoldásokkal kíván válaszolni. Az ajánlómotor egyik legfontosabb adatforrását a felhasználói értékelések jelentik, hiszen itt igazi véleményeket olvashatunk. Igaziakat? Nos, nem teljesen: 2021-ben a vezetők elismerték, hogy az értékelések közül 200 milliót (!) kellett blokkolniuk azok nem valódisága miatt. A szaksajtóban ezt az összes értékelés 30%-ának becsülték az elérhető adatok alapján. Egész kiterjedt iparág épül az álötcsillagos értékelések megírására, amelyben a résztvevők – jellemzően kínai megbízóktól – pénzt kapnak bejegyzéseikért. Ez torzítja a versenyt és hátrányba hozza a tisztességes kereskedőket, mivel a fogyasztók érthetően a magasabbra értékelt termékeket vásárolják.

Az Amazon nemrég bejelentette, hogy jelentős erőforrásokat fog a hamis értékelések kiszűrésére fordítani. Befektetnek a gépi tanulásba, hogy több ezer adatpontot elemezve vértezzék fel a rendszert a csalások kiküszöbölésére.

Beszélj a bolttal!

Ha már nagy játékos, akkor ne hagyjuk ki a sorból az e-kereskedelem online platformjáról világszerte ismert Shopifyt sem! A kanadai óriás kiskereskedőknek nyújt informatikai hátteret, digitális sales megoldásokat – nem csoda, hogy maga is egyre kiterjettebben használja a mesterséges intelligenciát.

A cég ugyanis idén júliusban mutatta be a Sidekick nevű, mesterséges intelligenciával rendelkező chatbotját, amely segíthet a kiskereskedőknek a webshopjaik újratervezésében és az értékesítési adatok elemzésében.

A Sidekick a Shopify Magic gépi tanulási funkciókat tartalmazó csomagjának a része. (A funkciócsomag az OpenAI LP GPT-4 modelljére épül.) A chatbot először a kiskereskedők weboldal-tervezésében nyújt segítséget. Az így elkészített weboldalakat természetes nyelvi bevitellel lehet majd módosítani. Sőt, a chatbot képes marketingszövegeket is generálni az általa létrehozott weboldalrészekhez. Emellett a Sidekick analitikára is használható. , Kérdezni lehet a webáruház működésével kapcsolatban, és az eredményekről kérdezz-felelek formában chatelhetünk a rendszerrel.

Látható, hogy a nagy halak egyértelműen a mesterséges intelligencia képességeik elmélyítése mellett döntenek. A jó hír az, hogy a kis cégek számára is könnyen elérhetőek a chatbotok. Ma már akár a kkv-k is szerényebb havi díjért MI-vel felokosított csevegőrobotokat használhatnak szerényebb havi díjért cserébe, például a költségesebb előerős ügyfélszolgálat helyett.

Megjelent az Xperience & Research magazin legújabb száma!

Bevezető szöveg: Megjelent az Xperience&Research, az NRC és a Clementine ingyenes szakmai magazinjának legújabb száma!
Iparág: Biztosítás

A 12 számot megélt Marketingkutató magazint 2017 szeptemberében váltotta fel az Xperience & Research: egy megjelenésében és tartalmában is friss, informatív és egyben szórakoztató kiadvány, exkluzív cikkekkel, interjúkkal.

Ízelítő a 2018 nyári lapszámból:

Interjú Szirmai Gergellyel, aki merőben máshogy méri a sikert
Neked nem iPhone-od van? De ciki!
Társadalmi nyomás az okostelefon és a közösségi oldalak használatában
Egy jó társas?
Vajon a digitális világ mellett játszunk még hagyományos társasjátékkal?
Asszem értelek
Valóban csak az egy generáción belüliek értenek szót egymással?
Játék az élet
Az első pixelektől a virtuális valóságig
A hitelfelvétel tűzkeresztsége
Az első hitelfelvétel benyomásai, generációs különbségei – kutatás
A mobil már nem státuszszimbólum
Mobil etnográfiai kutatás a Millennial szegmens telekommunikációs szokásairól
Influencer marketing – a nem mindenható
Tényleg minden marketinges vágyát valóra válthatják az influencerek?
Képernyőváltás: hol van a Z generáció?
Nagyon válogatósak, nem harapnak rá akármire, csak arra, ami igazán érdekli őket – de akkor mégis hogy szólítsuk meg a Z generációt?
Gépi logika vs. emberi döntés
Melyik a hatékonyabb a döntési folyamatban?
Watsonnal magyarul
Watson képes felismerni és megérteni a magyar nyelvet – megtanítottuk rá!
Sajtószemle szöveganalitikával
Miről beszéltünk 2017-ben? A szöveganalitika megmondja!
50 éves az SPSS
Fél évszázad mérföldkövei

A magazin ingyenesen megrendelhető a Ez az e-mail-cím a szpemrobotok elleni védelem alatt áll. Megtekintéséhez engedélyeznie kell a JavaScript használatát. e-mail címen.

Megszólaltattuk Elvirát

Iparág: Biztosítás

A Clementine, a SpeechTex és a BME közös fejlesztésének eredményeképp a MÁV ELVIRA utastájékoztató rendszere hang-alapú virtuális asszisztens szolgáltatással bővült.

Aki utazott már belföldön vonaton, vagy utazást tervezett, egészen biztosan találkozott a MÁV ELVIRA nevű népszerű menetrendkereső- és hozzá kapcsolódó internetes jegyvásárlási rendszerével, amelynek célja leegyszerűsíteni és meggyorsítani az utazás előtti előkészületeket. Mostantól egy hangalapú virtuális asszisztens segítségével várakozási idő nélkül, telefonon is megtudhatják a szükséges információkat az utazni készülők.

A MÁV hivatalos sajtóközleménye az alábbi weboldalon olvasható.

Elvira, a robotasszisztens egyszerre tíz utas hívását képes fogadni a MÁVDIREKT telefonos ügyfélszolgálatán, ennek köszönhetően az élőhangos operátorok munkájában energia és idő szabadul fel az összetettebb utastájékoztatási kérdések kezelésére.

Elvira a Clementine Hanga nevű virtuális asszisztens megoldásának kifejezetten a MÁV igényeire testreszabott változata. Három technológia integrációja teszi képessé, hogy megértse az utasok szándékát és megválaszolja azokat: leiratozás (speech-to-text), szövegbányászat és gépi tanulás, valamint beszédszintézis (text-to-speech).

„Elvira tanítását a MÁV által átadott valós hívások alapján végeztük: egyrészt ezekből tanulta meg a vasúttársaság és az utasok szóhasználatát, szókincsét, másrészt a mélyebb szöveganalitikai elemzéseink eredményei alapján alakítottuk ki a jelenlegi képességeket, melyekkel Elvira az utasok által a leggyakrabban kérdezett egyszerű menetrendi információkra ad gyors választ” – mondta el a fejlesztési folyamat kapcsán Körmendi György, a Clementine ügyvezető igazgatója.

A hatékony működés kialakítását szolgálta az is, hogy a tanítás során szoros együttműködés alakult ki a fejlesztésben résztvevők és az ügyfélszolgálatos kollégák között. Ennek a kommunikációnak az eredményeképpen az ő szaktudásukkal is kiegészítve létrejött rendszer képes megérteni számos magyar nyelvterületen előforduló szóhasználatot. A tematikus szöveganalitikai modell közel 2000 olyan alapkifejezést ismer, amelynek jelentést tulajdoníthatunk, és ehhez nagyságrendileg több tízezres mennyiségű előfordulás, szinonima tartozik.

Fejlesztése, tanítása és integrációja 2022. év elején kezdődött, a karácsony óta tartó tesztüzem során pedig közel 12 000 telefonálót szolgált ki. „A tesztidőszak tapasztalatai alapján számos szempontból finomhangoltuk Elvira képességeit és működését, megtanulta például hogyan pontosítsa az utazás időpontját, és hogy milyen sokféleképpen tudnak rákérdezni az utasok a kedvezményes árra. A vasúttársaságban közel 65 alapkedvezményt azonosíthatunk, melyeket az utasok meghatározhatnak a kedvezményre jogosító feltétel leírásával vagy akár a kedvezmény mértékével is, ezért csak ebben a kérdéskörben ezres nagyságrendű előfordulásokat feltételeztünk a szóhasználatot illetően” – árulta el a fejlesztésről Pancza Judit, a Clementine vezető elemzője, és hozzátette: „Az utazás időpontjának azonosítását az a tényező nehezíti, hogy az idő az emberek számára relatív, és sokszor magától értetődőnek vesznek olyan információt, ami valójában még el sem hangzott. Ezért is vált szükségessé az utazási időpont részletekben történő azonosítása, ha a helyzet úgy kívánja.”

A piacon eddig elérhető hang-alapú virtuálisasszisztens-szolgáltatásokkal szemben hazai fejlesztés. „Büszkék vagyunk rá, hogy a hang alapú virtuális asszisztensek terén mi alkothattuk meg az első olyan rendszert, amely teljes egészében magyar technológiára, magyar komponensekre épül” - mondta el Körmendi György. A szakember hozzátette: „Elsősorban a nagyvállalatok, illetve államigazgatási cégek számára javasolt egy ilyen rendszer bevezetése, ahol kellő számú telefonos megkeresés várható. Először egyeztetünk az ügyféllel, felmérjük a részletes igényeket, elemezzük az üzleti és technológiai helyzetet. Az eredmények visszaigazolják, hogy jól csináljuk. Épp ezért a MÁV számára kidolgozott rendszer sikere után nyitottak vagyunk az új megkeresésekre, együttműködésekre.”

A Clementine által kínált megoldásról további részletes leírás olvasható az alábbi weboldalon.

A Clementine-ról

A 2005-ben alapított Clementine már rövid idő alatt Magyarország vezető elemző, fejlett analitikai cégévé nőtte ki magát. Az IBM prémium szintű Business és Support partnere több évtizedes múltra tekint vissza adatbányászat, szöveganalitika, a hanganalitika, magyar nyelvű NLP alapú rendszerek kialakítása, fejlesztése terén. Rendszerei és megoldásai nem csak az elemzői feladatokat segítik, de csökkenhetik partnereik működési költségeit, vagy épp hatékonyabbá teszik egyes rendszereik működését.

Mesterséges intelligencia a 2025-ös CES-en

Iparág: Biztosítás

A 2025-ös Consumer Electronics Show (CES) egyértelműen a mesterséges intelligencia jegyében telt, a technológia szinte minden szegmensben megjelent. A kiállításon az MI már nem csak egy divatos kifejezés volt, hanem egy kézzelfogható, gyakorlati irány, amely egyaránt eléri a fogyasztói elektronikai eszközöket és a vállalati megoldásokat. Az alábbiakban a legfontosabb MI-vel kapcsolatos bejelentésekből és újdonságokból szemezgetünk.

Nvidia: az MI-infrastruktúra éllovasa

Az Nvidia vezérigazgatója, Jensen Huang nyitóbeszédében mutatta be a vállalat legújabb fejlesztéseit, amelyek az MI területén elért áttörésekről tanúskodnak. Az eseményen bemutatott Cosmos platform a fizikai MI fejlesztésének egy új szintjét képviseli. A Cosmos ugyanis lehetővé teszi a robotok és autonóm járművek képzéséhez szükséges fotorealisztikus videók generálását, csökkentve a hagyományos adatgyűjtési módszerek költségeit. A Cosmos lényegében egy világ-alapmodell, amelyet 20 millió órányi videóval képeztek ki, hogy az MI megértse a fizikai világot. Huang a Cosmos-t a robotika és az MI „ChatGPT-pillanatának” nevezte. (A Cosmos nyílt forráskódú licenc alatt elérhető a GitHubon.)

Az cég bemutatta a GeForce RTX 50 grafikus processzorcsaládját is, amely a Blackwell architektúrára épül. Az RTX 5090 GPU 92 milliárd tranzisztort tartalmaz, és másodpercenként 3352 billió MI-műveletet képes elvégezni. Az újgenerációs DLSS 4 technológia a mesterséges intelligencia segítségével javítja a játékok teljesítményét, akár három további képkockát generálva minden egyes kiszámított képkockához.

Az egyik legnagyobb izgalmat kiváltó hír: a Project DIGITS, egy személyes MI-szuperszámítógép, amely a GB10 Grace Blackwell Superchip-re épül. Ez az eszköz lehetővé teszi, hogy a fejlesztők desktopon is nagy teljesítményű MI-rendszereket használhassanak. A Project DIGITS elegendő számítási teljesítményt nyújt ahhoz, hogy komplex MI-modelleket futtasson, akár 200 milliárd paraméterrel. Két eszköz összekapcsolásával ez a szám 405 milliárd paraméterre nőhet, és mindez lokálisan is futtatható. Magyarán saját géppel építhetünk mi magunk nagy nyelvi rendszereket.

Az Nvidia az autonóm járművek területén is komoly előrelépéseket tett. A DRIVE AGX Thor fedélzeti számítógép az Arm Neoverse V3AE processzorra épül. Az Nvidia emellett bemutatta az Isaac GR00T Blueprintet, amely a humanoid robotok képzését segíti.

Samsung: MIndenhol

A Samsung a 2025-ös CES-en az "AI for All" vízióját mutatta be, amelynek célja, hogy a mesterséges intelligencia az "Everyday, Everywhere" (mindennap, mindenhol) élményévé váljon. A vállalat a Home AI stratégiájával az otthon fogalmát kívánja újradefiniálni, személyre szabott szolgáltatásokat kínálva az intelligens, összekapcsolt eszközökön keresztül.

A Samsung Home AI a felhasználói szokásokból tanul, és az egyéni rutinokhoz igazodik, ezáltal egy személyre szabott okosotthon-élményt teremt. A biztonság kiemelt szempont, a Samsung Knox Matrix kiterjeszti a védelmet az otthoni készülékekre, a mobil eszközökre és a televíziókra is. Az One UI egységes szoftveres élményt nyújt a Samsung eszközei között, a SmartThings platform pedig az MI segítségével még inkább személyre szabja a felhasználói élményt. A továbbfejlesztett Bixby hangasszisztens felismeri az egyéni hangokat és személyre szabott válaszokat ad.

A Samsung a kijelzők terén is újításokat hozott. A hűtőszekrények 9 hüvelykes MI Home kijelzőket kaptak, amelyek szórakoztató szolgáltatásokat, MI funkciókat és online élelmiszer-vásárlást tesznek lehetővé. A Samsung Vision AI javítja a képernyőélményt, személyre szabott funkciókat és MI-alapú képminőség-javításokat kínálva. A Bixby a látássérültek számára is könnyebben használható lesz a magas kontrasztú szövegek vagy hangos útmutatók automatikus engedélyezésével.

A Samsung a SmartThings Pro segítségével a vállalkozások számára is kínál MI alapú megoldásokat, az energiafelhasználás kezelésétől a készülékek karbantartásáig. A SmartThings for Ships a hajók automatizálását és rendszerfelügyeletét segíti. A Samsung emellett az autóiparban is terjeszkedik, a Hyundai-jal közösen építi be a SmartThings platformot az elektromos járművekbe, a Harmannal együttműködve pedig egy MI alapú digitális másodpilóta fejlesztésébe is belevágott.

Az autóipar MI-fejlesztései

A Tesla versenytársai talán megunták, hogy az autó + MI hírekben nem szerepelnek eleget, úgyhogy számos hír érkezett ebből a szegmensből.

Például a Toyota bejelentette, hogy a következő generációs járműveihez az Nvidia DRIVE Orint használja, egy olyan, az autonóm járművekhez tervezett platformot, amelyet leginkább a fejlett vezetéstámogató rendszerekhez (ADAS) kívánják használni.

Eközben a BMW Panoramic iDrive rendszere mesterséges intelligencia alapú interaktivitást valósított meg a műszerfalon, míg a Honda 3. szintű autonóm elektromos járműveket mutatott be MI-vezérelt személyre szabási és biztonsági funkciókkal.

További MI újdonságok

A CES 2025 számos más MI-vel kapcsolatos újdonságot is hozott, amelyek a technológia széleskörű alkalmazhatóságát demonstrálják:

Halliday okosszemüveg: A Halliday okosszemüveg egy apró, 3,6 mm-es optikai modullal rendelkezik, amely a keretbe van integrálva, így a lencse nem befolyásolja a megjelenítést. A "Digi Window" nevű kijelző zöld színű grafikákat, szövegeket és szimbólumokat jelenít meg, valós idejű MI-fordítást, teleprompter funkciót, értesítéseket és navigációt kínálva.
Natura Humana HumanPods: A HumanPods hordható fülhallgatókat használ az MI alapú asszisztensek eléréséhez, egyedi hangokkal és személyiségekkel.
Roborock Saros Z70: A Roborock új AI-porszívója látja a padlón lévő tárgyakat, mint például a zoknikat vagy a papucsokat, és egy robotkarral el is távolítja azokat az útjából. Ezen kívül az intelligens állatfelügyelethez is rendelkezik egy kamerával.
Gemini a Google TV-ben: A Gemini MI integrálása a Google TV-be lehetővé teszi a természetes nyelvi lekérdezéseket, a gyerekek házi feladatában való segítséget, az utazások tervezését, a hírek és az időjárás elérését, valamint az okosotthon-eszközök vezérlését.
Lenovo ThinkBook Plus Gen 6: A Lenovo ThinkBook Plus Gen 6 egy egyedi, feltekerhető kijelzővel rendelkező MI-laptop.

Talán érezhető e szubjektív összefoglalóból: az MI lassan túllép a hájpokon, és tényleg hosszú távú trenddé válik a szórakoztató elektronikában is.

MI a klímavédelemben

Iparág: Biztosítás

Az éghajlatváltozás nem csak közvetlenül hat az életünkre, de közvetett hatásai is vannak, amelyekbe gyakran bele sem gondolunk. Vegyük például a manapság sokat emlegetett inflációt, amely globális probléma és az éghajlatváltozás tovább súlyosbítja. Ennek oka, hogy a szélsőséges időjárási események gyakoribbá és súlyosabbá válása felhajtja az élelmiszerek és az energia árát. De van remény: A mesterséges intelligencia segíthet az éghajlatváltozás elleni küzdelemben a kibocsátások csökkentésével, az energiahatékonyság javításával és a megújuló energiaforrások használatának növelésével.

Épületes megoldás

A Nemzetközi Energiaügynökség korábbi összefoglalója szerint az épületek működtetése a világ villamosenergia-fogyasztásának mintegy 55%-áért felelős. Az előrejelzések szerint ez az arány 2040-re 80%-ra nő, ha nem teszünk lépéseket a hatékonyság javítása érdekében. Beszédes adat az is, hogy az Egyesült Államokban – a felhőkarcolók őshazájában – az épületek felelősek az összes széndioxid-kibocsátás 38%-áért! Jó hír, hogy a megoldásra egy példa is innen érkezik.

A Honeywell cég, amely az USA és a világ egyik legnagyobb ipari konglomerátuma, már évekkel ezelőtt létrehozta a Honeywell Forge nevű szolgáltatását, melyen belül a Honeywell Forge Performance+ for Buildings felel az okos épületekért. Ez a felhőszolgáltatás gépi tanulási modellek segítségével optimalizálja az energiafelhasználást, így a fogyasztás akár 10%-kal is csökkenhet, miközben a lakók komfortérzete nem változik.

Az energiaoptimalizálás ez esetben úgy működik, hogy a szolgáltatás folyamatosan elemzi a valós idejű állapot adatokat (vagyis az időjárási és a foglaltsági adatokat), a gépi tanulási modellek automatikusan kalkulálják a megfelelő paramétereket, melyek beállításra kerülnek a létesítmény HVAC-rendszerében (fűtés, szellőzés és légkondicionálás). Ilyen paraméter például a hűtővíz hőmérséklete, a kazánvíz hőmérséklete, a szivattyú fordulatszáma vagy a ventilátor fordulatszáma. A HVAC-rendszerek az épületek villamosenergia-fogyasztásának átlagosan 40%-át teszik ki. Ez azt jelenti, hogy ezek használatának optimalizálása közvetlen hatással van az energia-felhasználásra és a szén-dioxid-kibocsátásra.

Zöld lámpa az energiacsökkentésnek

A másik, kibocsátásban élenjáró terület a közlekedés, amelyben szintén sok szerepet kaphat a mesterséges intelligencia. Itt világszerte sok pilot program és kezdeményezés fut. Ázsiából például jó példa erre a kis városállam, a gazdaságilag fejlett Szingapúr CRUISE nevű projektje. A CRUISE már mintegy két évvel ezelőtt szenzorok beérkező adataira, a Big Data elemzésre alapozva dinamikus és okos módszert dolgozott ki az optimalizált és kevesebb károsanyag-kibocsátással járó közlekedés, a gyalogos- és autóforgalom összehangolására. Ennek végcélja a közúti lámpák MI alapú vezérlése lett, amely a sűrűn lakott országban releváns feladat.

Amikor a klíma- és állatvédelem találkozik

Ismét az USA-ba kell utaznunk, hogy lássuk, hogyan függ össze a klímavédelem az élőhelyeink megóvásával és a megújuló energiaforrások nagyobb arányú használatának lehetővé tételével. A Massachusetts melletti viharos vizek kiválóan alkalmasak az amerikai éghajlati célok eléréséhez kulcsfontosságú szélerőművek létesítésére. Az óceánnak ez a területe egyben egy ikonikus tengeri emlős, a kihalás szélére került észak-atlanti simabálna éghajlati menedéke is. Ahogy a keleti part mentén a tengeri szélerőműparkok fellendülése megindult, a mesterséges intelligencia segíthet megvédeni a bálnákat az építkezés során megnövekedett hajóforgalomtól.

Az amerikai Vineyard Wind kapott engedélyt arra, hogy ott az Egyesült Államok első igazán nagyszabású, kereskedelmi célú szélerőmű-parkját felépíthesse. Összesen 62 óriási szélturbina kezdi majd meg működését 2023 nyarán, hogy közel 400 000 háztartás számára elektromos energiát termeljen. De mi a helyzet a bálnákkal? Az Awarion nevű technológiát veti be a cég, amely mesterséges intelligencia és gépi látás használatával azonosítja e nagytestű vízi állatokat. Így időben figyelmeztetést kapnak a hajók kapitányai, hogy elkerüljék a bálnákkal történő ütközést. A rendszer a felszínen úszó bálnák háta alapján képes 80%-os bizonyossággal detektálni az állatokat. (Már vannak megoldások a felszín alatti azonosításra is).

Szerencsére – erős kormányzati nyomással, regionális együttműködéssel, vagy uniós direktívákkal – a zöldítés, a klímavédelem egyre fontosabb szerepet kap az ipar működésében. A mesterséges intelligencia olyan eszköz, amely képes felgyorsítani az emberiség éghajlatváltozás elleni küzdelmét, segítségével esélyünk van arra, hogy mindannyiunk számára fenntarthatóbb jövőt építsünk.

MI és a divat

Iparág: Biztosítás

Habár a Clementine a mesterséges intelligencia egy jól körüljárható, szűk részében tevékenykedik, épp e blogsorozat a bizonyítéka: jó, ha vigyázó szemeinket más iparágakra, területekre is rávetjük. Miért épp a divatipar maradna ki az MI térnyeréséből? Már önmagában, méreténél fogva is tekintélyes piacról beszélünk, a divattal, öltözködéssel, megjelenéssel kapcsolatos tevékenységek, az ez iránti érdeklődés, sőt, lelkesedés pedig szinte egyidősek fajunk civilizálttá válásával.

MI, divat, két jó barát

Nem véletlen, hogy épp a könnyűiparban (is) óriásnak számító Kína már korábban meglátta a lehetséges kapcsolatot a divat és a mesterséges intelligencia között. E célból hívták ugyanis életre az AIFA (Alliance for Artificial Intelligence in Fashion and Textil) elnevezésű szervezetet, amely 2018 óta már a harmadik konferenciáját szervezi. Már a legelső, Hong Kongban megtartott rendezvényükön olyan témákkal foglalkoztak az előadók, mint például a VR vívmányainak hasznosításával (érdekes kérdésként merült fel például a testszkennelés tökéletesítése), a gyártás során felmerülő szövethibák hatékony kiszűrését a konvolúciós hálózatok segítségével, a fogyasztóknak MI-alapú, személyes, fizikai jellemzői alapján ruhaajánlási rendszer megalkotásával, vagy éppen azzal, hogyan lehet gépi tanulással és a számítógépes látás technológiájával –historikus tranzakciós adatokból dolgozva – új divattermékeket automatikusan megalkotni.

Mint látható, a téma szerteágazó és izgalmas, ráadásul – az MI terjedése miatt – a nem szakmai fogyasztóréteg is elkezdett megbarátkozni a gondolattal: nyugodtan leírható egy mondatban az algoritmus és a divat szó is. Nem is állnak olyan messze egymástól.

Tipp Santorinire

A ChatGPT és a generatív mesterséges intelligencia vonatjára persze mostanában sok cég felugrott, a divat sem kivétel ez alól. Így tett az itthon is ismert, e-kereskedelemmel foglalkozó Zalando is. A német cég ugyanis még idén áprilisban jelentette be: virtuális asszisztens szolgáltatást tett elérhetővé néhány európai piacon a vásárlói számára. Az alkalmazás intelligensen igyekszik javaslatokat tenni, választ adni az olyan kérdésekre, mint például: „Idén júniusban egy barátom esküvőjére Santoriniban kerül sor. Mit vegyek fel a nagy alkalomra?” A divatasszisztensnek nevezett algoritmus kimondottan a divathoz tartozó kifejezésekre, azok megértésére és az intelligens válaszadásra specializálódott. Eseményhez, helyszínhez és különböző tevékenységekhez is ajánlhat kiegészítőket, ruhadarabokat. A cég egyik alelnöke szerint ezzel az ügyfelek saját szavaikkal és kifejezéseikkel navigálhatnak a Zalando kínálatában, így a felfedezési folyamat intuitívabb és természetesebb.

A még mindig csak 15 éves – tehát már a digitálisabb korban megalapított – Zalando már korábban is megcsillogtatta MI-képességeit. 2018-ban vezette be e-boltjának felületén az Algorithmic Fashion Companion (AFC) nevű gépi tanulási eszközt. Ez az algoritmus a vásárlásai alapján kezdte megtanulni a felhasználók ízlését, hogy újabb árucikkeket ajánljon az akkorra már háromszázezres méretűvé duzzadt divatcikk-kínálatából. Az algoritmust egymillió ruhadarabon tanították be, és folyamatosan „etetik” a trendekkel és a szezonra jellemző megoldásokkal. A házon belül fejlesztett AFC sikere is azt mutatja, hogy milyen hasznos, amikor egy cég a működésében az MI-nek fontos, és nem periférikus teret ad.

Neked az MI mondja meg, hogy mi a divat

Ennél is jövőbe mutatóbb – más kifejezéssel: extrémebb – módon nyúl a mesterséges intelligenciához az OpenFashion nevű japán cég, amely első számú céljának egy fenntartható divatipari ökoszisztéma kialakítását tartja. Elindították például az accelerando.ai almárkát, amely divattervezési versenyeket szervez – bárki benevezhetett a generatív MI által létrehozott divatmárkájával. Ezen kívül a ChatGPT API-jára épülő, kimondottan divatipari chatbotokat hoztak létre, például: divattervezőt, stylistot, PR-ost vagy HR-est is. Szöveg- és képgeneráló alkalmazásai nagy segítséget jelenthetnek a divatszakma demokratizálásában, az új tehetségek felfedezésében.

Modellek, akik sosem léteztek

2016-ban találkozhatott először a világ a cserfes félig brazil, félig spanyol modellel, énekessel és influenszerrel, Miquela Souzával. A sztori itt véget is ér: az MI-vel megalkotott lény (?) a Brud kreatívügynökség teremtménye. Ez azonban nem akadályozta meg a céget, hogy a röviden csak Lil Miquelának hívott virtuális lány szerződést kössön olyan divatipari cégekkel, mint például a Prada, a Calvin Klein vagy a Nike.

A Balmain Paris ruházati cég ennél is messzebbre ment: létrehozta saját „virtuális hadseregét” – egy olyan, virtuális modellekből álló csapatot, amely a kollekcióját reklámozza. Saját divatikonjaik születésénél igyekeztek széles nemzetközi rétegnek megfelelni, így látható, mit visel magán Margot, Shudu vagy éppen Zhi.

A tinédzser korú Noonoouri egyike a közel 40 olyan virtuális influenszernek, akiknek hivatalos, az Instagram által valódinak tartott accountja van, pont, mint egy homo sapiens celebnek. A kilencvenes évek kezdetlegesebb 3D-s animációjára emlékeztető, elképesztően színes Noonoouri ráadásul – megint csak a generatív mesterséges intelligenciának köszönhetően – énekelni is tud. (Hogy mennyire jól? Mindenki döntse el a klipje alapján.)

Jól látható, hogy a ChatGPT felkeltette hihetetlen érdeklődés farvizén minden iparág, így a divatban dolgozók is plusz eszközt kaptak – leginkább arra, hogy még jobban magukhoz vonzzák a vevőiket.

MI és az etika

Iparág: Biztosítás

2021-ben a nem szakmai közvélemény is megdöbbenéssel fogadta a hírt: a Google anyavállalata, az Alphabet viszonylag rövid időn belül két vezetőjétől is megvált. Ez így, önmagában, a gyorsan mozgó üzleti világban még nem meglepő. Azonban a két kutató, először Timnit Gebru, majd Margaret Mitchell a vállalat etikus MI-kutatásaival foglalkozó csapatának élén állt. A Google dolgozói ezres nagyságrendben tiltakoztak az idő előtti elbocsátás miatt.

MI és az etika

Új terület, új problémák

A mesterséges intelligencia a fenti esetekig a legtöbb ember számára pusztán technológiai vetületben jelent meg. Eszerint arra kell a cégeknek, kutatóknak választ adniuk: mikor lesznek önvezető autók, mikor jön el az öntudatra ébredt MI ideje, és hogyan lehetne a mindennapi életet automatizálva könnyebbé tenni?

A megfigyelésre épülő közbiztonság, a nagy adatmennyiségek begyűjtésére és elemzésére épülő nyelvi rendszerek – mint például a ChatGPT – megjelenésével új, a személyes jogainkat is érintő kérdésekkel szembesülünk. Az „AI Ethics”, vagyis a mesterséges intelligencia etikai aspektusai éppen ezért kapnak mind nagyobb nyilvánosságot, és vonják maguk után az átlagemberek érdeklődését is. Ez a terület sok témát ölel fel, melyekből most néhányat kiemelnénk.

Az első parancsolat: ne árts az embernek!

Az MI etika egyik legfontosabb területe e kőbe (még) nem vésett törvény megvalósítása, kikényszerítése. Idetartozik például a gyűlöletbeszéd tilalma. A probléma régebbi, mint gondolnánk: 2016-ban a Microsoft ráengedte a Twitterre a Tay nevű, MI alapú chatbotját, mely az emberekkel való párbeszéd során viszonylag hamar eljutott Hitler éltetéséig, úgyhogy le kellett kapcsolni. Most, a ChatGPT kapcsán sokan felvetik, hogy a nagyon intelligens beszélgetőpartnernek tűnő chatbot vajon nem okoz-e mentális kárt azokban az emberekben, akik tényleg komolyan veszik egy-egy emberinek tűnő válaszát? 2023 februárjában a New York Times technológiai újságírójának pont a Bing okozott – szó szerint! – álmatlan éjszakákat. A Microsoft keresőjébe kerülő ChatGPT ugyanis egy kétórás beszélgetésben azt tanácsolta a boldog házasságban élő férfinak: váljon el, hiszen úgysem szeretik egymást a párjával. Az ilyen kijelentéseknek felmérhetetlen következményei lehetnek a párkapcsolatokban szegény, rendkívül elmagányosodott, fejlett, nyugati világban.

Felelősség

Érdekes, hogy bár még nincs teljesen önvezető autó, mégis, a morális kérdések már itt is felvetődnek: például egy balesetben ki haljon meg, ha mindenképp döntenie kell a rendszernek: jobbra rántott kormánynál egy idős ember, balra rántott kormánynál pedig egy terhes anya lesz a baleset áldozata. Hogy döntsön az autó? Ki a felelős a döntésért?

De akár katonai példát is említhetnénk: Tegyük fel, hogy egy tökéletes arcfelismeréssel rendelkező drón parancsot kap egy terrorista kiiktatására. De helyette a megadott területen felbukkanó, civil ikertestvér lesz az áldozat – kié lesz a felelősség? Kit lehet később perbe fogni az ártatlan meggyilkolásáért?

Az ilyen és ehhez hasonló feltevések jól mutatják, hogy az etikai megfontolásoknak kimondottan fontos szerepe van már az MI-rendszerek fejlesztésénél is.

Elfogultság

Az MI-k nem légüres térben léteznek: mi, emberek szolgáltatjuk a működésük alapját jelentő adatmennyiséget. Ahol pedig emberi tényező létezik, ott megnő a hibázás lehetősége is. Így járt az Amazon is 2018-ban, amikor automatizálni akarta a munkaerő-toborzás, -felvétel folyamatát. Az MI-rendszernek megadta, hogy milyen típusú szakembereket vett fel eddig. A rendszer pontosan ezt is csinálta, azaz főleg férfiakat részesített előnyben a kiválasztás során. Az MI tehát, ahelyett, hogy az emberi elfogultságtól mentesen ítélt volna, felhasználta a cégnél már kialakult, nem egyenlőségpárti gyakorlatot.

Hasonló a helyzet akkor, amikor bűnügyi előrejelző rendszereket működtetünk. Ha a statisztikai adatokban valamelyik kisebbséghez tartozók felülreprezentáltak, akkor várható, hogy az MI-rendszer is így fog működni, vagyis újratermeli az előítéletet, de már technikai-tudományos alapokra helyezve. Erre már több példa is volt az Egyesült Államokban.

Ezeket a társadalmi folyamatokat, elvárásokat érintő gyakorlatokat csak emberi beavatkozással lehet a fair eljáráshoz hozzáigazítani.

Adatvédelem

Nemcsak Európában, de a demokratikus világban is kiemelt szerepet kap a személyes adatok védelme. (A korábban bevezetett GDPR rendelkezésnek is ez volt a célja.) Az arcfelismerő rendszerek elterjedésével felvetődik a kérdés, hogy mit tehetünk integritásunk és magánéletünk védelmében. Kié lesz, hol tárolódik a velünk kapcsolatos adat?

Az európai szabályozás

Az Európai Bizottság 2018 júniusában létrehozott egy, a mesterséges intelligenciával foglalkozó, magas szintű független szakértői csoportot a megbízható MI-re vonatkozó etikai iránymutatások összeállítására. A magyarul is 55 oldalas dokumentum legfontosabb iránymutatásai, amelyet az MI-rendszerek kifejlesztése, elterjesztése és használata során tiszteletben kell tartani, a következők:

meg kell felelniük a következő elveknek: az emberek autonómiájának tiszteletben tartása, kármegelőzés, méltányosság és megmagyarázhatóság,
különösen oda kell figyelni a hátrányos helyzetű, kirekesztés veszélyének kitett csoportokra vagy személyekre (például a gyermekekre),
az MI-rendszerek tervezésekor az az előre nem modellezhető veszélyeket szem előtt kell tartani (például a demokráciára, a jogállamiságra és az igazságos tehermegosztásravagy magára az emberi elmére gyakorolt hatásokat).

Kockázatok és mellékhatások

A cikk megírásakor érkezett a hír: a Microsoft, amely a rendkívüli népszerű ChatGPT anyagi és erőforrás-támogatója, elbocsátotta a teljes „mesterséges intelligencia etikai és társadalmi hatásával” foglalkozó részlegét. A szakmai közvélemény – hasonlóan a cikk elején említett Timnit Gebru esetéhez – felhördüléssel fogadta a hírt. Az elmúlt években a Microsoftnak ez a csapata ugyanis egy olyan, Judgment Call nevű szerepjátékot tervezett, amely segített a tervezőknek elképzelni a mesterséges intelligencia által okozott lehetséges károkat. Ez egy nagyobb "felelős innovációs eszköztár" része volt, amelyet a csapat nyilvánosan közzétett. A közelmúltban ráadásul a csapat azon dolgozott, hogy azonosítsa azokat a kockázatokat, amelyeket az OpenAI technológiájának a Microsoft által a termékcsaládjában történő átvétele jelent.
Úgy tűnik, hogy a céges MI-k „hidegháborújában” az etikai megfontolások háttérbe szorulnak, és a tervezés során ezeket már nem veszik olyan hangsúllyal számításba, mint előtte.

Valószínű, hogy egyre többet fogunk mi is találkozni a mesterséges intelligencia, az etikusan kezelt MI fontosságával.

Milyen problémára nyújt megoldást az IBM Watson Studio?

Bevezető szöveg: Hogyan tud könnyedén együtt dolgozni több, eltérő eszközt használó elemző úgy, hogy a részfeladataik közötti integráció a lehető legnagyobb legyen? Hogyan lehet a projektért felelős, valamint más személyeket kellőképpen bevonni egy egységes rendszerbe?,
Iparág: Biztosítás

Egy adatbányászati projekthez rengeteg erőforrás kell. Ezek körébe tartoznak triviálisan az analizálni kívánt adatok, de a különböző modellezési eszközök, a modellek, pipeline-ok vagy akár maguk az elemzők is ide tartoznak. Látható, hogy ezek menedzselése, felügyelet alatt tartása nem egyszerű folyamat. Sokszor a menedzsereknek, product ownereknek, valamint egyéb szereplőknek sincs megfelelő rálátásuk a feladatra, kicsúszik a kezük alól az irányítás, vagy esetleg nem tudják úgy végezni a feladataikat, mint ahogy az tőlük el van várva.

Egy-egy elemzési feladat több részfeladatra tagolható, mint adatbetöltés, adatok megismerése, adattisztítás, elemzés, vizualizáció, integrálás, üzemeltetés, eredmények kiértékelése, stb. Az adatbányászat opensource eszközeinek, valamint nyílt közösségének köszönhetően az elemzők sok különböző eszközt ismernek, továbbá mindenkinek megvan a saját kedvenc eszközkészlete, amellyel a leghatékonyabb, amelyet a legszívesebben használ. Ha ehhez hozzávesszük, hogy a gyártók, illetve cégek által kínált különböző eszközök és megoldások közül sem mindegy, hogy egy adott probléma során melyiket használjuk, akkor láthatóvá válik, hogy ez még tovább bonyolítja a projektek kezelhetőségét, integritását. Hogyan tud könnyedén együtt dolgozni több, eltérő eszközt használó elemző úgy, hogy a részfeladataik közötti integráció a lehető legnagyobb legyen? Hogyan lehet a projektért felelős, valamint más személyeket kellőképpen bevonni egy egységes rendszerbe?

Az IBM Watson Studio terméke ezekre a problémákra kínál megoldást.

A termék középpontjában egy projekt áll, mely a valós adatelemzési projektünket reprezentálja. Egy-egy projekt pedig különböző részelemekből épül fel, valamint különböző entitások rendelhetők hozzá. Maga a termék képes tisztán cloudos, hibrid cloudos, úgynevezett on-premise módon, valamint dedikált desktop alkalmazás keretein belül is futni.

A projekthez tartozik egy speciális Cloud object Storage tárrendszer, amelybe lehetőség van a saját lokális adataink feltöltésére, de különböző külső adatforrásokat is hozzácsatolhatunk a projekthez, legyen az egy folyamatos adatfolyamot szolgáltató stream adatforrás, vagy akár adatbázis.

A Watson Studio-ban található Data Refinery az adatok megismeréséhez, illetve tisztításához használható. Segítségével az adatelemzés scope-jában kevésbé jártas személyek is könnyen betekintést nyerhetnek az adatok struktúrájába, egyszerűen végrehajthatnak különböző adattisztítási lépéseket, valamint beszédes ábrákat hozhatnak létre az integrált vizualizációs eszköz segítségével. Az adatelemzéshez továbbá használhatunk különböző, általunk konfigurálható környezettel rendelkező notebookokat, melyekben R, Python, vagy Scala nyelven is végrehajthatjuk az elemzést, akár Sparkos módon is. A folytonosan érkező stream adatfolyamot a Streaming Analytics keretein belül elemezhetjük. Továbbá az SPSS Modelerhez nagyon hasonló Modeler Flow Editor felületen tudunk a Modeler streamekkel analóg, úgynevezett flow-kat, valamint különböző neurális háló architektúrákat létrehozni. Itt a hálókban használt különböző technikák, metrikák, valamint egyéb entitások vannak leképezve node-okra. Az elkészített hálót betanítva pedig különböző szolgáltatásként tudjuk deploy-olni a hálózat képességeit, legyen az akár egy webservice, vagy egy CoreML-t használó applikációhoz szükséges virtual container. A hálózatok betanításához, optimalizálásához, eredményeik összehasonlításához az Experiment Buildert használhatjuk. Miután a betanított modelleinket üzembe helyeztük, az eredményeket az üzlet szempontjából is meg kell vizsgálni, melyeket általában dashboardokon ábrázolunk. A Watson Studio-ban ezt a feladatot az Analytics Dashboard integrált eszközzel lehet végrehajtani.

Különböző speciális problémákra dedikált megoldásokat tartalmaz a Watson Studio. A természetes nyelvvel kapcsolatos feladatokhoz Natural Language Understanding, Natural Language Classifier, a döntésoptimalizáláshoz CPLEX engine, míg a képi felismerési feladatokhoz Visual Recognition modulok érhetők el.

Összefoglalásként tehát látható, hogy az adatelemzés által prezentált változatos problémákra és feladatokra a Watson Studio többféle, ám egymással szoros kapcsolatban lévő megoldást nyújt, az integrált eszközök képében. Az egész elemzési feladatot pedig egy összetartozó, felügyelhető egységgé képes alakítani.

Mistral: egy európai válasz az amerikai LLM-ekre

Iparág: Biztosítás

Megszokhattuk, hogy ha generatív mesterséges intelligenciáról van szó, akkor az USA termékeire, vállalkozásaira, startupjaira kell gondolnunk. C'est la vie? Nem egészen. A ChatGPT, Claude, Llama és társai mellett üdítő olyasvalamivel is találkozni, amely az öreg kontinens invenciója. Ez a Mistral, amelynek hona Franciaország – de nem csak ezért érdemes rá odafigyelni.

Born in France

A rendkívül fiatal, csupán 2023 áprilisában megalapított technológiai startup három, korábban a Meta és a DeepMind kötelékében dolgozó szakember gyermeke. Arthur Mensch, Guillaume Lample és Timothée Lacroix cége nevét a dél-franciaországi erős, hideg szélről kapta, amely a vállalat törekvését szimbolizálja az MI-technológia területén való gyors és jelentős előrelépésre. A Mistral AI azzal a céllal jött létre, hogy Európa vezető AI fejlesztőjévé váljon és alternatívát kínáljon az amerikai és kínai dominanciával szemben.

A már most hatmilliárd dollár értékűre taksált vállalat minden jelentősebb (OpenAI, Anthropic, Meta) versenytársához képest sokkal szerényebb méretű csapattal éri el újabb és újabb eredményeit. Eközben olyan fontos, a szakmában jelentős amerikai befektetőket is megnyert magának, mint például az Andreessen Horowitz.

A kis csapat nem tétlenkedett: már 2023 szeptemberében a publikum elé bocsátották első modeljüket, a Transformerre épülő Mistral 7B-t, amely – a nevéből is következően – egy hétmilliárd paramétert tartalmazó nagy nyelvi modell. Ezt követte két másik, majd idén júliusban elérhető lett a Mistral Large 2, amely már 123 milliárd paramétert , és nagyra nyitott, 128 ezres tokenablakot biztosított.

Nyitottan

A zárt nagy nyelvi modellekkel ellentétben a Mistral AI a nyílt rendszerekre fogad. 2024 októberében, alig egy évvel az első terméke után bemutatták a gyűjtőnevükön csak Les Ministraux-nak hívott csúcstechnológiás modelljeiket: a Ministral 3B-t és a Ministral 8B-t. A cég bejelentése szerint ez a két nagy nyelvi rendszer kiválóan teljesít például a jelenlegi legfontosabb fejlesztési területen, a logikai érvelésben, és speciális feladatokra, Agent-szerű munkafolyamatokban is kiválóan használható. A benchmarkokból látszik, hogy a Ministral 3B és 8B egyenrangú társa a szorosabban vett konkurenciának, a Gemmának és a Llamának.

A Mistral a nyerő?

A felhasználói közösség több olyan pontot is talált, amelyben a Mistral erős konkurensnek számít. Modelljeinek legfontosabb versenyelőnye a méretükhöz képest nyújtott kiemelkedő teljesítmény és a hatékony erőforrás-kihasználás. A Mixture of Experts architektúra használata innovatív megoldásnak számít, és a mistralok alacsonyabb hardverigény mellett is versenyképesek. A nyílt forráskód transzparenciát és közösségi fejlesztést, hibajavítást tesz lehetővé, az európai működés pedig a GDPR-nak való teljes megfelelést és erős adatvédelmi garanciákat biztosít.

Megjegyzik, hogy néhány európai nyelven kiemelkedőt nyújt, és sokan dicsérik kódgenerálási képességeit is.

Bárhogy alakul is hosszabb távon a verseny, a Mistral megkerülhetetlennek látszik.

Nagy nyelvi rangadó

Iparág: Biztosítás

Erre hivatkoznak a trónkövetelők, az újabb modellek, és ezzel büszkélkednek az élenjárók. A nagyméretű nyelvi modellek (LLM-ek) robbanásszerű fejlődésen mentek keresztül, és ez megkívánta az objektív összehasonlítást is. Éppen ezért megjelentek az LLM rangsorok (leaderboardok), amelyek célja, hogy összehasonlítsák a különböző modellek teljesítményét, és segítsék a fejlesztőket a megfelelő modell kiválasztásában. De vajon mennyire megbízhatóak ezek a rangsorok? A cikkben áttekintjük az LLM leaderboardok fogalmát, működését, az értékelési metódusokat, valamint a rangsorok hátulütőit és a velük kapcsolatos problémákat.

Miért van szükség leaderboardokra?

Az LLM Leaderboard-platformok különböző értékelési benchmarkok alapján rangsorolják a nagyméretű nyelvi modelleket. Ezek a rangsorok összehasonlító képet adnak a vezető modellekről, bemutatva, hogy azok hogyan teljesítenek a nyelvi megértéstől kezdve a tartalomgenerálásig terjedő feladatokban. Az LLM Leaderboardok a kutatók, fejlesztők és felhasználók számára is referenciaként szolgálnak, hogy felmérjék a különböző LLM-ek képességeit és fejlesztési területeit. A rangsorok rendszeresen frissülnek, szerepük rendkívül fontos a generatív MI gyorsan fejlődő területein, például:

Benchmarking: a rangsorok lehetővé teszik a fejlesztők számára, hogy modelljeik teljesítményét standardizált adathalmazok és feladatok alapján mérjék, világos képet adva arról, hogy hogyan viszonyulnak az iparág többi szereplőjéhez.

Innováció ösztönzése: a modellek teljesítményének nyilvános bemutatásával a rangsorok növelik az átláthatóságot és a versenyt.

Standardizált értékelés: a rangsorok szabványosított mérőrendszert biztosítanak a különböző LLM-ek értékeléséhez, egységes kritériumot kínálva, amely biztosítja az értékelések méltányosságát és következetességét.

Az LLM leaderboardok működésének lépései

Benchmarkfeladatok kiválasztása: a leaderboard üzemeltetői kiválasztanak egy sor olyan nyelvi feladatot, amelyeken a modelleket értékelni fogják. Ezek a feladatok általában a nyelvi megértés, a szöveggenerálás, a fordítás, az érzelmi elemzés és a kérdésmegválaszolás különböző aspektusait fedik le.

Adathalmazok összeállítása: a feladatokhoz megfelelő adathalmazokat kell összeállítani. Ezek az adathalmazok általában nagy mennyiségű szöveges adatot tartalmaznak, és reprezentatívnak kell lenniük a modell által megoldandó valós problémákra.

Modellek futtatása a benchmarkokon: a fejlesztők beküldik modelljeiket az értékelésre, amelyeket a leaderboard üzemeltetői lefuttatnak a kiválasztott benchmarkokon.

Eredmények értékelése: a modellek eredményeit a benchmarkokon elért teljesítményük alapján értékelik. Az értékelés során különböző metrikákat használhatnak, mint például:

Pontosság: a modell válaszának helyessége a referenciaadatokhoz képest.
Perplexitás: azt méri, hogy a modell mennyire jól tudja megjósolni a következő tokent egy szövegben.
ROUGE (Recall-Oriented Understudy for Gisting Evaluation) pontszám, amely az automatikus összegzés minőségét méri, összehasonlítva a modell által generált összegzést a referenciaösszegzéssel.
Diverzitás: a modell által generált válaszok változatosságát méri.
Emberi értékelés: emberi értékelők szubjektív véleményét veszik figyelembe a modell válaszának relevanciájáról, koherenciájáról és minőségéről.

A metrikák mellett az LLM-ek értékelésében szerepet kapnak olyan minőségi jellemzők is, mint a relevancia, a hallucinációra való hajlam vagy a toxicitás.

Az utolsó lépés mindezek után a rangsorolás, amelyben a modelleket az eredmények alapján sorrendbe állítják, és a leaderboardon közzéteszik a rangsort.

Toplista, de…

Az LLM Leaderboardok hasznosak lehetnek a modellek összehasonlításához és a fejlődés nyomon követéséhez, de fontos tisztában lenni a korlátaikkal és a velük kapcsolatos problémákkal.

A crowdsourced A/B preference testing során az emberi értékelők szavazatai torzítottak lehetnek a szubjektív preferenciák és az egyéni megítélés miatt. Például a legújabb tanulmányok kimutatták, hogy egyes LLM-ek emberi értékelései torzítottak a hosszúság szerint, ami azt jelenti, hogy az értékelők a hosszabb, nem feltétlenül jobb válaszokat részesítették előnyben.

Az LLM-ek túlzottan illeszkedhetnek a leaderboard benchmarkokhoz. Ez azt eredményezheti, hogy a modellek finomhangolása során a fejlesztők a rangsor javítására koncentrálnak ahelyett, hogy a modell általános teljesítményét optimalizálnák. A túlzott illeszkedés félrevezető lehet a lehetséges felhasználók számára, mivel a modell kiválóan teljesíthet a kontrollált tesztekben, miközben a valós feladatokban sokkal gyengébben.

Adatszennyezés, amely akkor fordul elő, ha a tanító adathalmazok tartalmaznak információkat a leaderboardokban használt teszthalmazokból. Ez mesterségesen felfújhatja a modell teljesítményét, mivel a modell felismerheti a tesztadatok részeit az értékelés során. A leaderboardoknak szigorúan el kell különíteniük a tanító és tesztelési adathalmazokat, és szigorú ellenőrzéseket kell végezniük az értékelési folyamat integritásának biztosítására.

A legújabb kutatások kimutatták, hogy az LLM leaderboardok rangsorolása rendkívül érzékeny lehet a benchmarkok apró változásaira. Például a kérdések sorrendjének vagy a feleletválasztós válaszlehetőségek sorrendjének megváltoztatása jelentős hatással lehet arra, hogy melyik LLM kerül a rangsor élére.

Van még hova fejlődni

Szakemberek számos javaslatot tettek már az LLM-ek megbízhatóbb értékelésére.

Először is, ahelyett, hogy általános benchmarkokat használnának, a fejlesztőknek olyan benchmarkokat kell létrehozniuk, amelyek relevánsak a modell konkrét felhasználási esetére.

A modellek teljesítményének átfogóbb értékeléséhez a fejlesztőknek több értékelési metrikát kell használniuk, ahelyett, hogy csak egyetlen metrikára támaszkodnának.

Az LLMOps, az MLOps specializált ága segíthet a fejlesztőknek az LLM-ek munkafolyamatainak automatizálásában és az adatszennyezés elkerülésében.

Az emberi értékelők bevonása az értékelési folyamatba segíthet a szubjektív szempontok, mint például a relevancia és a koherencia figyelembevételében.

A modelleket valós környezetben is tesztelni kell, hogy felmérjék a modell gyakorlati hasznosságát.

A legfontosabb Leaderboardok

Már most több platform kiemelkedik a többi közül, vagyis az LLM-ek fejlesztői leginkább ezekre hivatkoznak. Íme néhány ezek közül:

A Hugging Face Open LLM Leaderboardja a nyílt együttműködést és az átláthatóságot helyezi előtérbe az LLM-ek értékelésében. Számos adathalmazt és feladatot támogat, és ösztönzi a fejlesztők hozzájárulását, elősegítve a modellek sokféleségét és az értékelési módszerek folyamatos fejlesztését. A platform hat széles körben elfogadott benchmarkot használ az LLM-ek értékeléséhez, és kiszámítja az egyes modellek benchmarkjainak átlagát. Lehetővé teszi a modellek egyszerű szűrését a modell mérete, pontossága és egyéb attribútumok szerint.

Az Open LLM Leaderboard egy évvel ezelőtti indulása óta széles körben használt forrássá vált a gépi tanulási közösségben. A Hugging Face 2024 októberi közlése szerint az Open LLM Leaderboardot az elmúlt 10 hónapban több mint 2 millió egyedi felhasználó látogatta meg, és havonta mintegy 300 000 közösségi tag dolgozik rajta aktívan.

A Chatbot Arena Leaderboard a chatbotok komplex és árnyalt párbeszédek kezelésére való képességét teszteli, így hasznos a fejlesztők számára, akik a nyelv általi ember-számítógép interakció fejlesztésére összpontosítanak. Olyan benchmark-módszert alkalmaz, amely a konverzációs válaszok emberi értékelésére támaszkodik.

A Big Code Models Leaderboard a programozási nyelvek feldolgozására szánt modellek teljesítményét értékeli. A modelleket olyan feladatokon méri, mint kódgenerálás, dokumentáció és hibakeresés, betekintést nyújtva az egyes modellek szoftverfejlesztési környezetekben való hasznosságába. Az OpenAI által létrehozott, ember által írt programozási problémák adatkészletét használja, amelyet automatikusan lefordítanak több programozási nyelvre.

Végezetül, a CanAiCode Leaderboard rangsora a modelleket a programozással kapcsolatos feladatok kezelésére való képességük alapján osztályozza, a kódgenerálástól a különböző programozási nyelvekben felmerülő problémák megoldásáig. Ember által írt programozási interjúkérdéseket használ, és automatikusan teszteli az MI által generált kódot következtetési szkriptek és sandbox környezetek segítségével. Ez biztosítja az MI kódminőségének realisztikus tesztjét.

Nem szerelemre, hanem figyelemre van szükség

Iparág: Biztosítás

A mesterséges intelligencia történetében kevés olyan publikáció van, amely akkora hatást gyakorolt/hatást váltott volna ki, mint az Ashish Vaswani és a Google Brain kutatói által 2017-ben publikált „Attention Is All You Need" című cikk. Ez a dokumentum bemutatta a Transformer architektúrát, amely alapvetően átalakította a szekvenciális adatok feldolgozását, különösen a természetes nyelvi feldolgozás (NLP) területén.

A Transformer színre lép

A cikk – amely szellemes címét egy legendás dal elferdítéséből kapta – lényege egy új neurális hálózati architektúra, a Transformer bemutatása, amely a figyelem (attention) mechanizmusára épül. Ennek az a lényege, hogy a modell a bemeneti adatok különböző részeinek fontosságát dinamikusan súlyozza, így a fontosabb információkra koncentrálhat, a kevésbé relevánsakat pedig figyelmen kívül hagyhatja. A Transformer modell ugyanis minden egyes szóhoz hozzárendel egy fontossági súlyt, amely megmutatja, hogy az adott szó mennyire releváns az éppen generált kimenet szempontjából. Ez a súlyozás folyamatosan változik a mondat kontextusától függően Ez a megközelítés sokkal hatékonyabbnak bizonyult a szekvenciális adatok, például szövegek vagy idősorok feldolgozásában, mint a korábban elterjedt rekurrens neurális hálózatok (RNN).

Túl az RNN-en

A Transformer architektúra jelentősége abban rejlik, hogy számos (olyan) korlátot küszöbölt ki, amelyekkel a korábbi modellek szembesültek. Az RNN-ek például nehezen tudták kezelni a hosszú szekvenciákat, és a szekvenciális feldolgozás miatt a képzésük is lassú volt. A Transformer ezzel szemben párhuzamosítható, így sokkal gyorsabban lehet betanítani, és hatékonyabban tudja kezelni a hosszú távú függőségeket a szekvenciális adatokban.

Ez a hatékonyság és pontosság ugrásszerű fejlődést hozott a természetes nyelvi feldolgozásban, lehetővé téve olyan komplex feladatok megoldását, mint a gépi fordítás, a szövegösszefoglalás és a kérdések megválaszolása.

Egy új korszak kezdete: hogyan változtatta meg a Transformer az MI történelmét?

Az „Attention Is All You Need" című cikk megjelenése egyértelműen fordulópontot jelentett a mesterséges intelligencia történetében. A Transformer architektúra bevezetése számos területen hozott jelentős változásokat:

A természetes nyelvi feldolgozás forradalma: a Transformer lett az alapja a legmodernebb NLP-modelleknek, például a ChatGPT-nek. Ezek a modellek kimagasló eredményeket értek el a nyelvi fordítás, a szövegösszefoglalás, a kérdés-válasz rendszerek és számos más NLP-feladat terén.
Az MI-képességek demokratizálása: az előre betanított Transformer modellek lehetővé tették, hogy a fejlett MI-képességek szélesebb körű felhasználók és fejlesztők számára is elérhetővé váljanak. Így a kisebb szervezetek, startupok és kutatók is hozzáférhetnek a legmodernebb AI technológiákhoz anélkül, hogy jelentős erőforrásokra lenne szükségük.
Új kutatási irányok: a Transformer architektúra inspirálta a kutatókat arra, hogy új modelleket és alkalmazásokat fejlesszenek ki. Elveit ma már nem csak az NLP területén, hanem a képfelismerésben, a beszédfelismerésben, a gépi látásban és a bioinformatikában is alkalmazzák.

A cikk és a Transformer utóélete

A Transformer architektúra a sikere óta eltelt időszakban számos területen bizonyította hatékonyságát és sokoldalúságát. A nyelvi feldolgozáson túlmutató alkalmazások közül kiemelkedik például a képfelismerés. A Transformer modellek ugyanis képesek elemezni a képekben található komplex mintákat, és így javítani a képosztályozás, a tárgyfelismerés és a képgenerálás pontosságát. A gyógyszerkutatásban a Transformer segíthet a gyógyszermolekulák tulajdonságainak előrejelzésében, új gyógyszerek tervezésében és a gyógyszer-cél interakciók megértésében. Az egyre fontosabb területté váló bioinformatikában pedig a Transformer modellek jól alkalmazhatóak a fehérjék szerkezetének előrejelzésében, a genetikai adatok elemzésében és a betegségek diagnosztizálásában.

A Transformer technológia jövője rendkívül ígéretes. Ahogyan a modellek egyre nagyobbak és hatékonyabbak lesznek, és ahogyan az adathalmazok is bővülnek (habár ez a kapu lassan bezárul), a Transformer várhatóan még jelentősebb eredményeket fog elérni a különböző területeken. A self-attention mechanizmus és a párhuzamos feldolgozás további optimalizálása, valamint az új alkalmazási területek felfedezése a Transformer technológiát a mesterséges intelligencia meghatározó elemévé teheti a jövőben.

Utóirat: mi lett a szerzőkkel?

Érdekes megnézni, hogy az „Attention All You Need”-et megalkotó kollektívának hogyan folytatódott 2017 után a pályafutása. Nos, az általánosan elmondható, hogy a 8 szakember mindegyike maradt ezen a területen, de változatos karrierutat jártak be. Közülük is talán a legizgalmasabb – és egyben az MI-versenyfutásban jellemző – a sorsa Noam Shazeernek: 2021-ben kilépett a Google-tól, hogy saját cégét, a Character AI-t sikerre vigye. A startup 2023 márciusára elérte az egymilliárd dolláros cégértéket (unikornissá vált), de 2024-ben a Google „visszavásárolta” Shazeert a Character AI-jal együtt 2,7 milliárd dollárért. Shazeer ma a Google saját modelljének, a Gemininek a társvezetője. Ezzel számára a „kör bezárult”.

Pénzügyekben nem ismer tréfát

Iparág: Biztosítás

Miért éppen az élet olyan meghatározó részét ne érintené a mesterséges intelligencia, mint a pénzügyeink? Ha van olyan terület, amelyben igazán szükségünk van racionális, elfogulatlan, emberfeletti tudással bíró gépi segítségre, az a pénztárcákat érintő kérdések – céges és személyes szempontból egyaránt.

Van benne fantázia (és pénz)

A Mordor Intelligence (igen, ezt a nevet valószínűleg még ember adta a cégnek!) szerint 2026-ra az AI 26 milliárd dollárnyi piacot fog jelenteni a pénzügyek területén. Az Insider intelligence szakportál pedig egyenesen azt prognosztizálja, hogy az elmúlt éveket is beleszámolva a mesterséges intelligenciával megtámogatott banki alkalmazások 447 milliárd dollárt takarítanak meg az emberek számára. Ezek a nem elhanyagolható összegek mutatják, hogy sok startupper, innovátor és befektető képzeletét megmozgató ágazatról van szó.

A jövő éppen, hogy csak elkezdődött. De van olyan terület, ahol az AI már nemcsak a lábát tette be, hanem „bent van a házban”, és egyre elképzelhetetlenebb nélküle a mindennapi munka. Emlékszünk még az 1980-as évek amerikai tőzsdén játszódó filmjeleneteire? Nos, ebből a szempontból a Tőzsdecápák egyik fejezetének vége. A plaketten álló, hadonászó, idegbaj és szívinfarktus szélén táncoló öltönyös szakemberek világát a digitális jelek vették át.

Modern tőzsdecápák közt

Az algoritmus alapú kereskedést mintha az ég is a tőzsdei, pénzügyi tranzakciók menedzselésére szánta volna. Nem véletlen, hogy ez a technológia az elmúlt években átalakította a pénzügyi iparágat, és a kereskedők minden eddiginél gyorsabban, pontosabban és nagyobb hatékonysággal tudják végrehajtani az egyes műveleteket.

Hogy jön a képbe a mesterséges intelligencia? Az AI-t az algoritmikus kereskedésben az óriási mennyiségű adat elemzésére, minták és trendek azonosítására, valamint az előrejelző (prediktív) modellek létrehozására használják. Mivel a pénzügyi piacokon az árak és a trendek gyorsan és sokszor kiszámíthatatlanul változnak, az AI közel valós idejű adatfeldolgozási képessége aranyat ér. Ennek köszönhetően a piac elemzése könnyebb, és megalapozottabb döntéseket tesz lehetővé. Ráadásul a mesterséges intelligenciával dolgozó modellek idővel képesek tanulni és alkalmazkodni is. A piaci adatok folyamatos elemzésével, a kereskedési stratégiáknak a múltbeli teljesítmény alapján történő kiigazításával az AI-algoritmusok idővel javíthatják pontosságukat és nyereségességüket.

Lefüleli a csalásokat

Egy minden eddiginél digitalizáltabb, összekötött világban a pénzügyeink is egyre nagyobb veszélynek vannak kitéve. A mesterséges intelligencia azonban itt is a segítségünkre siethet.

Vegyük például a JP Morgan Chase esetét! Az egyik legrégebbi és legnagyobb amerikai banknál a fogyasztók számára nyújtott banki tevékenység a nettó bevétel több mint felét teszi ki. A Chase egy saját, mesterséges intelligencia alapú algoritmust fejlesztett ki: ez minden egyes hitelkártya-tranzakció részleteit az adatközpontban lévő központi számítógépeknek küldi el, amelyek eldöntik, hogy az adott művelet csalásgyanús-e vagy sem. (A Chase egyébként az egyik legnagyobb bizalmi pontszámot elért pénzintézet egy amerikai felmérés szerint.)

Vagy nézzünk egy másik példát 2022 márciusából. A Shift Technology nevű cég, amely a globális biztosítási ágazat számára AI-alapú döntésautomatizálási és optimalizálási megoldásokat szállít, valamint a Duck Creek Technologies, a P&C biztosítási ágazat technológiai megoldásainak globális szállítója bejelentették, hogy partnerséget kötöttek. A cél: megjelenni a piacon AI alapú csalásdetektáló rendszerrel. A teljes körű integrációt követően a Duck Creek felhasználói így valós idejű csalásjelzéseket kapnak majd közvetlenül a kárrendezési szoftverrendszerükbe.

A kockázatok és mellékhatások helyett: előnyök

A fintech világa erős forrásban van: a mesterséges intelligencia mellett intelligens chatbotoktól, blokklánc-alkalmazásoktól, web3-fejlesztésektől és neobanki megoldásoktól hangos a szaksajtó. Az AI előnyei a pénzügyi területen a fogyasztók számára már világosan megtapasztalhatók: perszonalizálhatóság, személyre szabott tanácsadás (pl. befektetési lehetőségek a bevételi és a költségminta alapján), automatizáció és biztonság.

Természetesen ehhez az kell, hogy az átlagember is minél jobban értse, mit tesz, tehet érte az AI, a szabályozásnak védenie kell az emberek érdekeit, és – mint a pénzügyi szolgáltatás területén általában véve is – a bizalom megerősítésén szükséges az érintett feleknek dolgozniuk.

Ez a cikk a teljesség igénye nélkül mutatott be két területet, ahol a mesterséges intelligencia és a pénzügy szerencsésen találkozik. Ha körbenézünk, egyre több feladatban jelenik meg az AI: a kockázatmenedzsmenttől kezdve a portfóliókezelésen át a mobilbankolásig bezárólag, és gyanítható, hogy a sornak még nincs vége.

Platina-szintű partnerek lettünk!

Bevezető szöveg: Az elmúlt évek sikeres együttműködése és a folyamatos fejlesztések alapján 2020. március 2-án megkaptuk az IBM-től a legmagasabb, Platina-szintű partneri besorolását.
Iparág: Biztosítás

Az elmúlt évek sikeres együttműködése és a folyamatos fejlesztések alapján 2020. március 2-án megkaptuk az IBM-től a legmagasabb, Platina-szintű partneri besorolását. Ez a legmagasabb szintű partneri státusz, melyet a szakértelmünk, a kiváló ügyfél referenciáink, a vizsgák és az IBM szoftverek viszonteladásából származó éves forgalmunk nagysága alapján érdemeltünk ki.

Az IBM elismerése azért is kiemelkedő, mert meghatározásuk szerint a Platina szint a kiválóságot, együttműködést és szakértelmet szimbolizálja.

Köszönjük Partnereinknek a bizalmat és az IBM-nek az elismerést!

Rekord év a MÁVDIREKT-nél: több százezer utasnak segített Elvira

Iparág: Biztosítás

Rekord teljesítménnyel ünnepli megújulásának 10. évfordulóját a MÁV-START telefonos ügyfélszolgálata, a MÁVDIREKT. Az elmúlt évben a kommunikációs csoport 750 ezer hívást bonyolított le, a 2023-ban bevezetett Elvira robotasszisztens pedig 333 ezer alkalommal segített az utasoknak. A mesterséges intelligenciára épülő, hang-alapú virtuális asszisztens fejlesztésében a Clementine is jelentős szerepet vállalt.

2023-ban MI-vel erősített az Elvira

2023 januárjában „állt munkába” az Elvira robotasszisztens, melynek fejlesztésében a Clementine is jelentős szerepet vállalt. Elvira ugyanis nem más, mint a Clementine Hanga nevű virtuális asszisztensének a MÁV igényeire testreszabott változata.

A robotasszisztensben három technológia olvad össze: a beszédfelimerés, a szövegbányászat és gépi tanulás, valamint a beszédszintézis. Ezek mindegyike szükséges ahhoz, hogy a virtuális asszisztens képes legyen megérteni és megválaszolni az utasok által feltett kérdéseket.

2023 októberétől Elvira újabb funkcióval bővült: a mobiltelefonról hívók számára képes SMS-ben elküldeni a lekérdezett menetrendi és jegyárra vonatkozó információkat.

10 éve az utasok szolgálatában

2014-ben a MÁVDIREKT jelentős átalakuláson esett át, melyben központi szerepet kapott a telefonos ügyfélszolgálat megújítása, a MÁVDIREKT menürendszerének átrajzolása, felhasználóbarátabbá tétele.

Rögtön az első évben 540 ezer hívást kapott az ügyfélszolgálat, ma pedig, 10 évvel később, már több mint 750 ezer megkeresést fogadnak, a várakozási idő pedig alig 39 másodperc. Az átalakulás óta egyébként összesen 5,6 millió hívás futott be az ügyfélszolgálatra. Jelentős forgalmat bonyolított a MÁVDIREKT az e-mailek terén is: 10 év alatt 300 ezer levélre válaszoltak, csak 2023-ban 57 ezerre.

Elvira integrálása óriási lépést jelentett az ügyfélszolgálat számára, mivel az egyszerű feladatokat elvégzi, így az ügyintézők az összetettebb tudást igénylő kérdésekre koncentrálhatnak. A robotasszisztens az elmúlt évben 333 ezer alkalommal segítette az utasokat.

RÖVIDHÍR KOMMENTÁRRAL - "Jósolni nehéz, különösen, ami a jövőt illeti."

Iparág: Biztosítás

A generatív MI térnyerésével a pár éve még slágernek számító fejlesztői állások kilátásai megrendültek. Vajon szükség lesz-e programozókra a következő évtizedben, vagy a teljesen átalakuló szakmák sorsára jutnak az ezzel foglalkozók? Lehet, hogy a programozás, ahogy az utóbbi évtizedekben megismertük, már a múlté?

Az Nvidia vezetőjének nagyívű jóslatáról és a Microsoft elképzeléseiről kérdeztük munkatársunk véleményét.

LINK: https://vulcanpost.com/857532/the-end-of-coding-microsoft-publishes-a-framework-making-developers-merely-supervise-ai/

Hálátlan feladat ehhez a hírhez kommentárt írni, rögtön a vitatott eredetű idézet jutott az eszembe:

"Jósolni nehéz, különösen, ami a jövőt illeti."

Mindenesetre Jensen Huang, az Nvidia CEO-ja szerint már nem olyan jó ötlet kódolni tanulni, mint korábban volt, legalábbis nem mindenki számára. Az biztos, hogy terjed az MI felhasználása ezen a területen, és az is látható, hogy egyre ügyesebbek is a különböző generatív transzformerek a programozásban. Ezzel párhuzamosan, sorban érkeznek hírek a programozó iskolák bezárásairól és a munkaerőpiaci kereslet alacsony szintjéről. Eljött hát a vég?

Ne feledjük, hogy az együttjárás nem feltétlenül jelent oksági kapcsolatot!

Nem hiszem, hogy az MI jelenleg kiválthatná a humán programozókat. Az elbocsájtások mögött nem ez, hanem inkább gazdasági okok állhatnak. Azt se felejtsük el, hogy mihez viszonyítunk. A pandémia idején az IT megoldások fontossága megugrott, a karanténokkal, kijárási korlátozásokkal tarkított időszakban az online kapcsolattartás vált a meghatározóvá, a képernyőidők pedig a home office óráin kívüli is kilőttek. Ekkor a tech-cégek a növekvő kereslet miatt jelentősen bővítették az állományaikat, a Meta 2019-2022-es időszakban például majdnem megduplázta dolgozóinak számát.

A 2022 után következő elbocsájtásokat tekinthetjük az inga visszalengésének is. Összességében és hosszabbtávon a növekvő tendenciához való visszatérés tűnik valószínűbbnek.

Más kérdés azonban, hogy a szakmabeliek munkáját valóban átalakíthatja az MI elterjedése. Azt eddig is láthattuk, hogy a hard skillek, és 1-1 programnyelv ismeretének fontossága csökkent, és inkább a soft skillek, logikai képességek és tanulási kompetenciák értékelődtek fel, hiszen a gyorsan változó környezetben az adaptáció a kulcs. Ezt a folyamatot felgyorsíthatja az MI fejlődése.

A „programozó” egy nagyon tág fogalom. A köznyelvben ide tartozhat a szoftvermérnöktől kezdve, a front-end, back-end vagy full-stack szoftverfejlesztő, a data scientist, de akár a data engineer és az IT architect is. A fejlesztők munkájának monoton, szó szerinti „kódolás” része csökkenni fog, és hangsúlyosabbá válhat a programtervezés, más kreativitást is igénylő feladatok elvégzése, illetve az MI által generált programkódok ellenőrzése. A programozást eddig sem robotmunkaként végzőkre minden bizonnyal még hosszú ideig szükség lesz. Lehet, hogy az Nvidia CEO-jának abban igaza van, hogy „kódolni” tanulni nem most a legjobb, de a programozás sokkal több is lehet, mint „kódolás”.

Úgyhogy azok számára, akiket valóban érdekel a szakma és nem pusztán anyagi okokból vágnának bele, azt javaslom, hogy bátran keressenek olyan képzést, ahol elsajátíthatják a szükséges gondolkodásmódot, elméleti alapokat, és ha megfelelő szintre tudják fejleszteni a képességeiket, biztosan megtalálják a helyüket a szektorban.

Gergely Norbert, elemző, Clementine

RÖVIDHÍR KOMMENTÁRRAL - A NEM ChatGPT pillanat!

Iparág: Biztosítás

A nemrég végetért CES (Consumer Electronic Show) egyik nagy bejelentése a legmodernebb chipeket tervező, 2024-ben egy ideig a világ legértékesebb vállalatának számító Nvidia nevéhez fűződik. Az amerikai óriás ugyanis bemutatta Cosmos platformját, amely egy World Foundation Model, amely szerintük a „ChatGPT pillanat a robotika számára”.

Valóban küszöbön a robotika forradalma ezzel a megközelítéssel? Szakértő munkatársunk véleménye következik.

LINK: https://www.nvidia.com/en-us/ai/cosmos/

KOMMENT

Azonnal megcáfolom a ChatGPT pillanatot. A ChatGPT csak szeretné, hogy olyan pillanata legyen valaha, mint az Nvidia új szolgáltatásainak. Miért?

Az Nvidia pontosan tudja, hogy milyen nyereséges nagyvállalati alkalmazása van már most, és lesz a szolgáltatásainak.

De milyen szolgáltatásról beszélünk? A felszínét figyelve a dolognak videógenerálási-képesség fejlett fizikai alapokon. Mélyebbre nézve gravitáció, súrlódás, ütközés, képen nem szereplő objektumok kezelése. „Na jó — mondja a prompt szakember —, hogy mekkora promptot írok?!”

Nem írunk promptot, a valóságot szimuláljuk, digitális ikreket alkalmazunk.

A digitális iker a szimulációban, szemei és helyzete a valós világban.

Az egyszerű, alacsony számítási kapacitású munkagépek a gyárban mozognak, és teszik a dolgukat. De mi a dolguk? A digitális virtuális gyár szimulációban - merthogy felépítjük a gyárat - minden fontos és kevésbé fontos tárgy, dolog rögzítve van, a következő munkafeladat megtervezve, ahogy a várható gépi és nem gépi mozgások is. A virtuális gyár mögötti rendszer számol, a robot végrehajt.

Csak egy példa: a mozgó ember-objektumok sebessége, vélt tömege, és a terület, melyet lépéssel vagy eséssel kitölthetnek, folyamatosan figyelve van. Eleshetsz a cipőfűződben, de mire felállnál, az a gépi kar, ami amúgy dobozt pakol, ha kedvességre van programozva, felsegít, ha elér. Persze életszerűbb alkalmazás, hogy ha veszélyes irányba esik a személy, a gép azonnal megáll, kikerül, mérsékeli a sérülést.

Raktár szimuláció egy nézete – feladatok, útvonalak, veszélyzónák

Tovább emelve a tétet, az Nvidia új modelljei teljesen nyitottak, ingyenesek. De miért is? Nvidia hardware kell hozzá, és itt érhető tetten a nagybetűs üzlet. A hardware-en van a nyereség, ám ahhoz az kell, hogy megvegyék… de mindenki, aki nagy és számít, a partnerük, nemcsak az új modelljeik kapcsán, más MI ügyekben is.

A rózsaszín ködöt kicsit elhessegetve van rá esély, hogy nem EU MI szabályzónak megfelelő a modell, hiába nyitott a kész modell, a training adatokat be kell mutatni, és a rossznyelvek szerint van benne nem kevés óra YouTube videó - de majd lesz EU model checkpoint is, ezen egy fél percig sem aggódok.

Összefoglalva: az Nvidia megálmodja helyettünk a jövő gyárát, logisztikai központját, és ez az álom tetszik a cégeknek. Mi kell hozzá? Nvidia szaktudás, szakember, chip. No brainer üzlet! Amikor az MI buborék kipukkan, csak a valós értéket termelő megoldások maradnak piacképesek, az Nvidia ott áll majd a hiú MI ábrándok búcsúztatóján, számolgatva a nagyvállalati sikerekből begyűjtött nyereségét.

Csatlós Béla, szakértő, Clementine

RÖVIDHÍR KOMMENTÁRRAL - Gemini 1, 1.5, 2 - őszinte vélemény karácsonyra

Iparág: Biztosítás

A Birodalom visszavág? A Google bemutatta a saját nagy nyelvi modelljének, a sokak által lesajnált Gemininek a 2.0-ás változatát, és meghirdette az MI-ágensek korszakát. Mit gondolunk a bombasztikus sajtóközleményről? Tényleg megtartja digitális királyságát és relevanciáját a keresőóriás? Munkatársunk kommentálja a hírt.

LINK:https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ceo-message

KOMMENT

Szép ígéretek, de vajon igazak? A Gemini 2.0 az ajtón kopogtat - valamiért korán be kell jelenteni, nehogy elfelejtsük, hogy jön. A Gemini 1.5 már egy ideje itt van. Meg is kérdeztem, hogy mi a véleménye az érkező nagytesóról.

Képes beszámoló következik!

A válasz ekkora MI versenyben elfogadhatatlan! De nem vagyok türelmetlen, bemásolom neki a szöveget.

A brossúra szintű válasz hibátlan, de nézzünk kicsit mélyebbre!

”Ügyes!” Nem lenne igazságos a vizsgálódás, ha ugyanilyen kötetlen stílusban megfogalmazva ne tenném fel a kérdésemet egy, a Geminit versenytársként kihívó alkalmazásnak, a Perplexitynek, aki GPT-4 és Claude-3 technológián alapul.

Az első kérdésre összetett, nem túl hosszú választ adott, egy frappáns befejezéssel.

A hasznosságra vonatkozó kérdésre adott válasz is elfogadható.

Fontos az első benyomás! Gemini, ez a második részemről/Gemini, nekem ez már a második, és a trend nem biztató. A Gemini egy tapadós, eltávolíthatatlan, tolakodó, passzív-agresszív titkár a mobiltelefonokon. Nincs önálló alkalmazásként azonosítva: érdemben eltávolíthatatlan! Miért is? Mert akkor törölnék! Ha már karácsonyi pofonosztás, a Siri európai inkarnációja (18.2) is egy tehetségtelen idióta, de legalább kedves! Megkértem, hogy rajzoljon macskát… finom úrihölgy módjára kiszervezné a munkát 😊

De akkor mi az igazság? Az MI-t használó keresés már a jelen, a használható általános MI asszisztens inkább még a jövő. A Gemini 2.0 -nak – illetve, hogy karácsonykor ne legyen magányos - az EU Sirinek pedig fa alá a verdikt:

Csatlós Béla, szakértő, Clementine

RÖVIDHÍR KOMMENTÁRRAL - MESTERSÉGES ÉRZELMI INTELLIGENCIA?

Iparág: Biztosítás

A Dartmouth Egyetem kutatói nemrég publikáltak egy, a maga nemében úttörő jelentőségű tanulmányt. Eszerint a generatív mesterséges intelligenciával működő terápiás chatbotjuk, a Therabot jól teljesített az embereknél: a szoftver jelentős javulást hozott a depresszióban, szorongásban vagy étkezési zavarokban szenvedő résztvevők tüneteiben.

LINK:https://home.dartmouth.edu/news/2025/03/first-therapy-chatbot-trial-yields-mental-health-benefits

KOMMENT

Az első robotpszichológus, Eliza, a 60-as években még nagyon messze volt a mai rendszerek képességeitől, de beszámolók szerint bizonyos ideig már ő is fenn tudta tartani egy emberrel való beszélgetés illúzióját és a rogersi terápia alapelvei mentén beszélgetést folytatott. 2025-ben viszont úgy tűnik, már ott tartunk, hogy a nagy nyelvi modellek nem csak imitálják az emberi kommunikációt, hanem klinikai tesztekkel igazolható módon képesek terápiás eredményeket is felmutatni.

Az mesterséges intelligenciával kapcsolatos fejlemények nyomon követésében a technológiai kérdéseken túl az egyik legizgalmasabb aspektus számomra, hogy milyen új dolgokat tudunk meg magunkról, mi emberek a folyamat során?

Vajon mégsem annyira esszenciálisak a valódi szociális kapcsolatok, lehetséges, hogy elég azoknak az imitációja is? Bár ez egy radikális gondolat, de bármennyire szomorúan hangozhat is ez a hír az idealisták számára, összességében örvendetes is lehet az egyre inkább elmagányosodó világunkba. Ha úgy nézzük, az emberi pszichoterapeuták is szerepet kell, játsszanak egy terápiás folyamatban, és ha ez a szerepjáték működik, miért ne működhetne gépekkel is? Ráadásul a kapacitáshiány egy valós probléma ezen a területen is. Egy MI alapú terapeutával időt lehet nyerni, sőt Vannak, akik kifejezetten szívesebben beszélgetnek egy géppel, gondolván, hogy az biztos nem ítélkezik felettük, például szociális szorongásokkal terhelt emberek, akiknek elképzelhető, hogy emiatt még hatékonyabb is lenne egy robottal folytatni bevezető terápiát?

Egyre több helyről hallom ismerősi körben, hogy sokan osztják meg érzéseiket, lelki gondjaikat általános chatbotokkal és meglepően pozitív tapasztalatokról számolnak be. Vajon a gépek egyre jobbak – vagy mi, emberek vagyunk egyre rosszabb hallgatóság? Valószínűleg mindkettő igaz. Persze nem szabad elfelejteni, hogy a chatbotok „kedvessége” nem sajátjuk – amit mi látunk belőlük, az csak egy álarc amit a fejlesztőik maszkíroztak rájuk. De ettől még akár arra is alkalmasak lehetnek, hogy mi tanuljunk tőlük, hogyan kommunikáljunk figyelmesen, asszertíven, türelemmel. Nehogy az legyen a vége, hogy nem csak a munkánkat veszi majd el a mesterséges intelligencia, hanem a barátainkat is.

Zsilinszki Anna, elemző, Clementine

RÖVIDHÍR KOMMENTÁRRAL - MI Krónika 2024

Iparág: Biztosítás

RÖVIDHÍR:
A Stanford Egyetem Mesterséges Intelligencia Intézete idén is publikálta átfogó MI-jelentését. 2024-ben – tekintettel a szakmai terület iránti felfokozott érdeklődésre – az eddigieknél is vastagabb lett a riport. A 10 legfontosabb megállapításból vajon melyikhez fűz kollégánk kommentárt, és miért pont ahhoz?

LINK: https://aiindex.stanford.edu/report/

Kiváló a bevezetőben megfogalmazott attribútuma a Stanford Egyetem Mesterséges Intelligencia Intézete által publikált MI-jelentésnek: teljesség. Félezer oldalnyi információ: aktuális, érdekes, izgalmas - mindez úgy, hogy napjainkban a mesterséges intelligenciával kapcsolatos hírek sokasága és a kiélezett versenyből eredő újabbnál újabb bejelentések elérték a „Mordkontra! Hirschkontra! Fedák Sári!” szintet.

MI-jelentés, index – száraz nagyvállalati, avagy mély akadémiai tartalmat sejtet. Nem is lehetne nagyobbat tévedni: ez egy képes krónika, az MI-vel kapcsolatos hírek hiteles gyűjteménye, hol szórakoztató, hol tényszerű, de okvetlen informatív, sőt számos nehéz kérdésben közérthető válaszokat nyújt.

Krónika-ajánlóként két téma: egy apró, de fontos érdekesség kiemelése mellett nézzünk bele a nehéz kérdések sommás megállapításaiba:

Okosabb az MI, mint az ember 2023/24-ben?

Tervezésben, érvelésben és úgy általánosságban a komplex-kreatív feladatokban elmarad az emberektől, de már vannak feladatok, amelyekben a humán teljesítményt messze meghaladja.

Mennyire általános és globális az MI-fejlesztés?

Szürreális utópia, hogy az MI az emberiség számára egyenlően hozzáférhető lesz. A fejlesztések terén különösen torz a kép. Az USA viszi a fejlesztéseket, majd az EU és Kína. Az arány 12:4:3. Egy másik dimenzióban nézve: globálisan 2023-ban 72 projektből 15 tisztán akadémiai, a többi piaci vagy piaci és akadémiai együttműködés.

Mennyire bíznak a befektetők az AI-ban, él még a hype?

Acht-Eight-八个

Egy adott lufi maximális mérete akkor határozható meg a legpontosabban, mielőtt kipukkan. Az MI befektetések 2022-es megtorpanását követően, 2023-ra nyolcszorosára nőtt a befektetések mértéke: 25 milliárd dollár! A hype fokozódik!

A cikk végére egy érdekesség, az MI-vel kapcsolatos szabályozók számáról.

Sokszor szokás hangsúlyozni, hogy az EU az MI szabályozással élen jár, és a szabályozás szigora lehet, hogy versenyhátrányt okoz. Viszont a piaci és társadalmi hatásokat EU szinten nézve, közép- és hosszú távon, a szabályzás következményei előnyösebb környezetet hoznak létre.

A fenti ábra alapán, a nagy EU MI szabályozó, csak csepp a tengerben, számos EU-s tagállam rendelkezik szakterület specifikus MI szabályozókkal, az USA pedig egyenesen vezeti a listát és a szabályozások sokasága ellenére az innovációt is.

Csatlós Béla, IT Support, Clementine

RÖVIDHÍR KOMMENTÁRRAL - MMLU, TTFT és egyéb állatfajták, avagy az MI megoldások mérése érthetően

Iparág: Biztosítás

Az OpenAI bejelentette új modelljét, a ChatGPT-4o minit. Vajon mi lehet az oka annak, hogy Sam Altman cége is beállt a kisebb modelleket alkotó vállalatok, így például az Anthropic (Claude 3.5 Sonnet) vagy a Google (Gemini Nano) sorába?

LINK: https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

KOMMENT:

Itt a GPT-4o mini! Jó? Jó! Vegyem meg? A vásárlás gomb megnyomása előtt, e rövid cikk elolvasása érdemben segítheti a tájékozódást.

A cikk a gyártó saját oldalán közölt saját cikke saját termékéről, tehát érdemes ellenőrizni állításait, megnézni, hogy a vélt vagy valós konkurensek mit szólnak a termékhez. Még ezen vizsgálat kezdeményezése előtt, a szövegben ígérgetésre lehetünk figyelmesek - amelyek már-már piaci standardnak számítanak. Nem egy termékleleplezést követően (sőt során!) derül ki, hogy valami nem pont úgy van, ahogy elhangzik, vagy a szolgáltatások még érkeznek, vagy az egész szolgáltatás csak később érhető el… itt például ígéret hangzik el a funkciók bővítésére. De ki fog arra figyelni fél év múlva? Majd vagy megnevezik a modell új verzióját, vagy teljesen új brand születik!

Visszatérve az MI megoldások méréséhez, milyen lehetőségek vannak?

Az MI megoldások mérésére kialakított MMLU tesztek (különböző tudományokban megméretve, mennyire sikeresen válaszol a modell) eredményeinek szemmel verése, vagy további elemzése nem segít az összehasonlításban, egy metrika a sok közül. A mérőszámok értése, pedig rendkívül száraz és fárasztó – olvasása könnyed szórakozás címen semmilyen korosztálynak nem ajánlott. Ellenben a cím ígérete alapján megkísérlünk adni egy érthető áttekintést címszavakban, melynek eredményeképp a modellek piacán nem veszünk tévedésből haiku helyett szonettet vagy lámát.

Input token ár

Az API kérésben küldött token ára. Jellemzően millió token / USD a mértékegység. Egy token 3-4 karaktert jelent.
Legkedvezőbb ajánlatok - GPT-40 mini / Llama 3 (8B) / Claude 3 Haiku/

Output token ár

A modell által generált eredmény ára.
Legkedvezőbb ajánlatok - GPT-40 mini / Llama 3 (8B) / Mistral NeMo/

Minőség

Az MMLU és különféle speciális vizsgákon mért eredmények metrikába emelése. Érdemes a célfeladat specifikus képességeket értékelni. (pl. van olyan, ami kódolni tud, de a tudástesztben alulmarad)

Kontextus ablak

Az input és output kombinált maximuma. A RAG LLM modellekre épülő folyamatok számára fontos mutató. (RAG tipikus esetpélda, a saját dokumentumokon kérdés-válasz funkció kialakítása)
Legnagyobb kontextus ablakok - Gemini 1.5 Pro/ Gemini 1.5 Flash / Claude 3.5 Sonnet

Kimeneti sebesség

A másodpercenként beérkező tokenek száma attól az időponttól, hogy az API elküldte az első választöredéket. A modell generálási tevékenység alatti token előállítási sebességeként is értelmezhető. A nagyobb érték a jobb.
Legnagyobb kimeneti sebességek - Mistral NeMo / Gemini 1.5 Flash / Llama 3 (8B)

Latency (TTFT)

Az első token beérkezési ideje az API kérést követően. Minél alacsonyabb, annál jobb!
Legjobb latency - Mixtral 8x22B / Llama 3 (8B) / Mistral NeMo

A fenti képességek az építő elemei összetett generatív MI kiértékeléseknek, melyeknek leginkább beszédes dimenziói, az alábbiak:

Minőség vs. kimeneti sebesség vs. ár

Minőség vs. kontextusablak vs. input token ár

Latency vs. kimeneti sebesség

De itt még nincs vége, az ördög a további részletekben lakozik, zsákjában lapul agyzsibbasztóan több mélyelemzési lehetőség (szintén önállóan és komplex módon)

napi rendszeres mérésekkel alátámasztva
100, 1000, 10000 token mennyiségre
variancia elemzés
párhuzamos lekérdezések futtatásával

A kofaszlenghez tartozó top ajánlásokban, a GPT-4o a kedvező ár dobogós jelöltje - továbbá a modell minősége is nagyon jó. No-brainer jó üzlet! Nagyvállalati alkalmazása esetén azonban mindenképpen vizsgáljuk meg, hogy minden metrika szempontjából megfelel-e számunkra!

Csatlós Béla, IT Support, Clementine

RÖVIDHÍR KOMMENTÁRRAL - Nem a „digitális isten” proxy-ja az okos turmixgép

Iparág: Biztosítás

A mesterséges intelligencia egyik zászlóshajójának, a kanadai Cohere társalapítója szerint újra kell gondolnunk az MI-kről szóló retorikát. Mit gondol erről munkatársunk?

LINK: https://techcrunch.com/2024/08/08/cohere-co-founder-nick-frosst-thinks-everyone-needs-to-be-more-realistic-on-what-ai-can-and-cannot-do/

KOMMENT

Az IBM SPSS Modeler – „MI kliens alkalmazás” - kezdő képernyőjét kell megidéznem!

Hello, Nick Frosst! Üdv a fedélzeten nálunk, MI józan gondolkodóknál! Akik munkájukat végezve azt látták, hogy minden, amit évek óta készítenek és működik, varázsütésre MI-vel felruházott lett.

Hogy nem lehet teljesen buborék az MI? Mert nem az! Értéket termel (a „gyenge” MI elég régóta). Mitől részben buborék az MI? Nincsenek céhek, így a tisztességes munkából megélők mellett szép számmal akadnak szerencsevadász projekt-szélhámos MI nagymester aspiránsok. A túlfűtött MI bevezetési versenyben nagyon nehéz megmondani, hogy ki a tisztességes startup, és ki a hullócsillag. A hullócsillagokba fektetett és csóvaként elégő dollármilliók a buborék légüres terének alkotó elemei! Hiú MI ígéretek!

Nick, igazad van! Nem lesz a jelenlegi fejlesztési ösvényeken szuperintelligencia, csak MI villanyszámlát támogató atomerőmű! Az MI kijózanodás elkezdődött, egyes felmérések szerint az átlag konyhai felhasználók nem szeretnék, ha az MI-vel felruházott turmixgép csatlakozna a hely WLAN-hoz, lokációs információt kérdezne le, engedélyt kérne a mikrofonhoz és a közösségi médiához, a megnövelt felhasználói élményért.

De darál -e jeget?

Csatlós Béla, szakértő, Clementine

RÖVIDHÍR KOMMENTÁRRAL - Sam Altman és a techno-szociális hálózat

Iparág: Biztosítás

Sam Altman, a ChatGPT-t megalkotó OpenAI vezérigazgatója egy optimista jövőképpel állt elő a „The Intelligence Age” című rövid írásában. Hogyan értékeli a cikkben foglaltakat munkatársunk?

Sam! Mind the Gap!

LINK: https://ia.samaltman.com/

KOMMENT

Sam Altmant homlokon csókolta egy rózsaszín unikornis hátán ülő szivárványos hajú múzsa, ennek köszönhető az álomszerű víziója, ami kegyes csacskaság kategóriába teszi napi problémáinkat a társadalomban, éppúgy, mint a mesterséges intelligencia területén. Átevickélve korunk nehézségein, vár minket egy olyan jövő, amelyből visszatekintve a korábbi munkavégzés „jelentéktelen időpazarlásnak” tűnik.

Keresem a szavakat, hogy mi a megfelelő metafora arra, hogy mekkora a szakadék a valóság és az altmani vízió között, de mivel nem földi mértékekre van szükség, és nem akarok túlzásokba esni, ezért legyen 2 - azaz kettő - csillagászati egységnyi!

Számos támadott teória közül az egyik kedvencem, amely a technológiai civilizációk önelpusztítási képességéről szól, napról napra aktuálisabb. És nem, nem a mesterséges intelligenciát tartom a vég kezdetének.

A tempó az, ami veszélyes. Az MI-hez kapcsolódó területeken szédítő a tempó, minden más technológiai szinten pedig megdöbbentő a fejlődés. A társadalomban pedig a komplexitás elképesztő növekedése tapasztalható, de érdemi fejlődés nem. Bár nem is biztos, hogy fejlődésre van szükség, mint inkább a tempó felvételére. Az emberi társadalmi hálózat, mint minden hálózat, rendelkezik egy olyan változási időablakkal, amelyen belül a hálózat alkalmazkodni tud a változáshoz, ami, ha túl gyors, drasztikusan érintheti a hálózatot - akár szét is eshet. A kérdés az, hogy mit bír ki az emberiség hálózata a technológiai gyors változások korában.

Eljöhet az intelligencia azon korszaka, amelyben átalakulnak a munkakörök. De nem lesz-e majdan jelentéktelen időpocsékolás a robotok emberi szervizelése, a bűn útjára léptett mesterséges intelligencia megfékezése és végtelen szerzői jogi viták értelmezése a gép-ügyvédek és gép-bírók között?

Idézem Sam mester ide vonatkozó szavait: „egy kevés ezer nap és itt a szuperintelligencia”. (A „kevés” elfogadott angol definíciója alapján, a kontextus a meghatározó a kevés számszerűsítésénél, így e cikk frissítését a szuperintelligenciáról a jogutódra hagyom, 2126. novemberére.)

Csatlós Béla, szakértő, Clementine

RÖVIDHÍR KOMMENTÁRRAL - TÁVOLSÁG A NYÚL, MINDEN ÉJJEL VISSZAHULL

Iparág: Biztosítás

Szerte a weben nagy vihart kavart Dario Amodei, a népszerű Claude nagy nyelvi modellt kiadó Anthropic cég vezetőjének egy friss írása. Ebben a szakember azt taglalja, hogy félő: soha nem fogjuk megérteni, mi zajlik az MI-rendszerek belsejében.

LINK:https://www.darioamodei.com/post/the-urgency-of-interpretability

KOMMENT

A „távolság a nyúl, minden éjjel visszahull”, de írhatnám azt is, hogy „the new price is 10 x (0.30 + 2) = 3.20.⏎⏎Thank you for correcting my mistake”. De mi is ez a kaotikus szétesés? Bizony nem más, mint egy nagy nyelvi modell magyarázhatóságához vezető epikus küzdelem aprócska csörtéje.

A hogyan és merre válasz vizuális elemzésért kiált. A példa pedig nem más, mint (4+5)*3 matematikai feladvány.

Részleteit tekintve pedig még érdekesebb. A logikai folyamat teljes Hieronymus Bosch-i zavarból tisztul le. Emberi gondolatfolyamatként imitálva:

„Kilenc! Hipotalamusz, 13 cm, a nyúl 9 métert ugrott vissza, egyértelmű 10-6, asszisztens, 7 wattos demultiplexer! Kilenc, Nince, Nove, 009, 41, 50-59 Fahrenheit ideális hőmérséklet.”

A fenti ábra a Claude Haiku nagy nyelvi modell egyszerűsített attribúciós grafikonja, arról, hogyan számolja ki a feladványt.

A képen 3 Feature verzióból egy van bemutatva. A folyamatrész több, mint 10 elemű, ami akár 30 különböző Feature használatát is jelentheti. Napjaink legtrendibb modelljei több millió, teljesen eltérő témához kapcsolódó Feature-rel rendelkeznek. Ezeket kell MIND megvizsgálni ahhoz, hogy magyarázhatóvá tegyük a nyelvi modelleket.

De a feladat nem csak ennyi, a magyarázhatóság nyitja meg a lehetőséget, a hibák és program működésének javítása felé.

A cél voltaképpen a nagy nyelvi neurális hálók magyarázhatatlan voltával kapcsolatos Black Box tézis megdöntése.

Dario Amodei és társasága hisz ebben az útban, melynek várható befejezése 5-10 év, mely időszak alatt ömleni fognak az újabbnál újabb modellek, olyanok, amelyek már nem tudnak érdemi új tanítóadatból építeni, amikor a több számítási kapacitás már nem javítja az eredményt; olyan modellek fognak érkezni, amelyek mögött vagy új know-how lesz, vagy beleszürkülnek a modellkibocsátási verseny középmezőnyébe – ahol nincs profit, csak költség.

Dario Amodei sem tudja, hogy mit hoz az MI jövője, de egy dolgot biztosan lát: magyarázhatóság nélkül a generatív MI számos üzleti területből kizárja magát. „Azok a számos üzleti területek”, azonban lehet, hogy évek óta használnak adatbányászati és prediktív analitikai megoldásokat, melyeket MI-megoldásként illik hívni 2025-ben. Szóval meg lehet nyugodni, nem lehet kimaradni az MI-hypeból, ha már 15 éve benne vagy…

Csatlós Béla, Clementine, szakértő

RÖVIDHÍR KOMMENTÁRRAL – A világmodell építése jól halad

Iparág: Biztosítás

RÖVIDHÍR: Az OpenAI egyik kutatója szerint 2027-ben érkezhet az általános célú mesterséges intelligencia (AGI). Becslésének megalapozottságáról, a kutató érveivel kapcsolatos gondolatairól kérdeztük munkatársunkat.

LINK: https://nonint.com/2024/06/03/general-intelligence-2024

Aki ezt a cikket olvassa, valószínűleg hallott vagy olvasott már korábban is ehhez hasonló jóslatokat. Szerintem az ilyen kijelentések értelmezésénél talán a legfontosabb az, hogy az adott szerző hogyan definiálja az AGI-t, azaz az általános mesterséges intelligenciát. (Ugyanez érvényes az AI-val vagy az I-vel kapcsolatos kijelentésekre is. Érdekes mellékszál: az intelligencia bizonyos definíciója akár egyes növényekre is teljesülhet – Kessler, Mueller: Induced resistance to herbivory and the intelligent plant, 2024. április.)

A szerző az általános intelligenciát az alábbi három feltétel teljesüléséhez köti, pontosabban ezek egy speciális szintéziséhez:

az entitás komplex környezetének érzékelése és az azzal való interakció
a környezetére vonatkozó robusztus világmodell (intuíció vagy gyors gondolkodás)
tetszőleges témák elemzésének képessége (okoskodás vagy lassú gondolkodás).

Az AGI egy tetszőleges feladat megoldására tervet készítene az elemző képességét és a világmodellt felhasználva. Az optimális tervnek megfelelően elvégezné az interakciót a környezetével, majd az erre kapott választ összehasonlítaná azzal, amit a világmodellje szerint várt. Szükség esetén a fenti lépéseket ciklusban ismételve hozná létre a megfelelő megoldást, illetve folyamatosan javítaná a világmodelljét. Ezt a ciklikus működést megbízhatóan alkalmazva oldana meg általános feladatokat.

A világmodell építése jól halad, bár a robusztusságáról vannak viták. A környezettel való interakcióról szintén el lehet képzelni, hogy néhány éven belül eléri a megfelelő szintet. Itt valószínűleg elég lesz tovább fejleszteni a jelenlegi fizikai eszközöket és szoftvereket.

A három feltétel közül a harmadik tűnik a legnehezebben teljesíthetőnek. A szerző ugyan optimista, de még nem tudunk olyan szoftverről, amely tetszőleges témához kötődő problémákat tud „elemezni”. Speciális problémákra vannak használható megoldások (pl. AlphaGeometry), de általános feladatokra ez még nem megoldott. A legtöbb ilyen optimista jóslat abból indul ki, hogy az eddigi fejlődési ütem folytatódni fog, de elképzelhető, hogy elérkezünk egy plafonhoz, és megáll a fejlődés.

Fontos probléma lehet még a GPT modellek „hallucináció”-ja. Ha az AGI-t például arra szeretnénk használni, hogy tanárokat helyettesítsen, akkor nem lenne előnyös, ha például alternatív történelmet tanítana a diákoknak.

Persze az is lehet, hogy az összes problémát megoldják 5 éven belül, de szerintem ez túl optimista jóslat. Volt már sok hasonló: hol vannak például az önvezető autók?

RÖVIDHÍR KOMMENTÁRRAL – Kínai MI-kutatók az USA-ban

Iparág: Biztosítás

Az új, különösen a mesterséges intelligenciát is érintő hidegháború egyik területét a szakemberek, tehetségek megtartása jelenti. Mit csináljon az USA, amely már most is nagyrészt pont a kínai, emigráns szakértelemre épít?

Az alábbiakban munkatársunk véleményét olvashatják.

LINK: https://www.brookings.edu/articles/us-security-and-immigration-policies-threaten-its-ai-leadership/

KOMMENT

A fenti cikk rámutat, hogy az Egyesült Államok mesterséges intelligencia terén elért globális dominanciája jelentős mértékben kínai tehetségekre támaszkodik, ami egyre törékenyebb alapot jelent. Bár olyan amerikai vállalatok, mint az OpenAI és a Microsoft, az innováció élvonalában vannak, világos, hogy a kínai szakemberek kulcsszerepet játszanak ezekben a sikerekben. 2022-es adatok alapján a világ legjobb MI-kutatóinak közel fele kínai volt, ami rávilágít arra, hogy az amerikai MI-ipar sikere a külföldi tehetségek beáramlásától nagyban függ. Éppen ezért az amerikai biztonsági és bevándorlási politikák, amelyek korlátozzák a külföldi kutatók beáramlását, hosszú távon veszélyeztethetik az USA versenyelőnyét. Az MI olyan globális iparág, amely az együttműködésre és a legjobb szakemberek bevonására épít. Ha az Egyesült Államok túlságosan bezárkózik és biztonsági félelmei miatt elidegeníti ezeket a szakértőket, azzal hosszú távon lelassíthatja saját fejlődését.

Másik fontos szempont, hogy a kínai kutatók és mérnökök hozzájárulása nem csak technikai tudást jelent, hanem kulturális sokszínűséget is, ami kulcsfontosságú az innovációban. A különböző háttérrel és látásmóddal rendelkező szakemberek sokszor olyan megoldásokat és ötleteket hoznak, amelyek új perspektívákat nyitnak meg a technológiai fejlesztések előtt. Az amerikai gazdaság és MI-ipar egyik legnagyobb előnye éppen ebben rejlik: a globális tehetségek szintézisében.

A nyitottabb bevándorlási politikák mellett azonban az USA-nak hosszú távon növelnie kellene a belföldi STEM (természettudomány, technológia, mérnöki tudományok és matematika) oktatás színvonalát és vonzerejét is, például a hátrányosabb helyzetben lévő tanulók pénzügyi támogatásával, a felzárkóztató programok fejlesztésével. Ha képes saját diákjait megfelelően felkészíteni a technológiai karrierre, akkor hosszútávon kevésbé lesz kiszolgáltatva a külföldi tehetségeknek.

Az Egyesült Államoknak el kellene ismernie, hogy a tehetségek megtartása nemcsak a gazdasági előnyökről szól, hanem stratégiai fontosságú a globális versenyképesség fenntartásában is. Ha az USA nem tart lépést a tehetségek áramlásának kezelésében, Kína – ahol az MI oktatás és kutatás is folyamatosan fejlődik – hamar átveheti a vezetést.

Molnár Anna, junior adatelemző, Clementine

RÖVIDHÍR KOMMENTÁRRAL – Mire elég Grok tudása?

Iparág: Biztosítás

Ígéretéhez híven Elon Musk a GutHubon elérhetővé tette a Grok nevű generatív MI-chatbot alapmodelljének súlyozását és hálózati infrastruktúráját. Miért jelentős ez a lépés? Munkatársunk kommentálja a hírt.

LINK: https://x.ai/blog/grok-os

Elon Musk megosztó, de abban talán mindenki egyetért, hogy korunk egyik meghatározó személyisége, aki körül zajlik az élet. Számos cég kötődik a nevéhez, amik számtalan területen tevékenykednek és nem ritkán felforgatják a teljes iparágat.

A Tesla új fokozatba kapcsolta az elektromosautó-ipart, a SpaceX az űrtechnológiát, a The Boring Company pedig a városi és városok közötti közlekedésben szeretne – szó szerint – új dimenziót nyitni az eddigi kétdimenziós működéshez képest.

Az elmúlt évek legnagyobb szenzációja viszont az MI, és azon belül is a nagy nyelvi modellek (LLM-ek) voltak, amikből eddig úgy tűnhetett, hogy Elon Musk kimarad. Bár a ChatGPT-t létrehozó OpenAI alapítói közé tartozott, kiszállt a cégből, miután az – elmondása szerint – rossz irányba fordult. Többször nevezte a mesterséges intelligenciát az emberiségre leselkedő legnagyobb kockázatnak is, és a fejlesztések lassítása, felfüggesztése mellett érvelt. Az MI vonat viszont nem lassított, a ChatGPT óriási népszerűségre tett szert, a Meta és a Google fejlesztői is gőzerővel dolgoztak a saját megoldásaikon. Ilyen körülmények között Musk sem maradhatott ki, és 2023 júliusában bejelentette új mesterséges intelligencia cége, az xAI indulását. De vajon sikerül-e ezt az iparágat is felforgatnia?

Néhány hónappal később be is mutatták Grokot, a teljesen saját fejlesztésű nagy nyelvi modelljüket.
A tempó gyors, de be lehet-e hozni a hátrányt? Az eredmények ígéretesek. A Grok-0 prototípus több teszten is felülmúlta a Meta Llama2-es modelljének eredményeit, pedig „csak” 33 milliárd paraméterrel rendelkezik, ami kevesebb mint a fele a Llama-2 70 milliárdos számának.
A Grok-1 314 milliárd paraméteres modelljével pedig szintet léptek, és mind kódgeneráló, mind matematikai és multidiszciplináris teszteken is megelőzték a hasonló méretű modelleket, köztük a GPT 3.5-öt is, csak a jelentősen nagyobb tanítóadatbázison készült modellek teljesítettek jobban, mint például a GPT-4.

Ezen benchmarkok érvényességét azonban többen vitatják, mivel a modelleket kifejezetten az ezeken való jó szereplésre hangolják. Hogy láthassuk, hogyan állják meg a helyüket valós élethelyzetekben, a magyar származású taggal (Christian Szegedy) is rendelkező fejlesztőcsapat a hazai középszintű matematika érettségi feladatsorán is letesztelte Grokot. Az 59 százalékos teljesítmény nagyjából 6%-kal magasabb, mint a magyar diákok idei átlageredménye, és sokkal jobb, mint a GPT-3.5 42%-os, vagy a Claude-2 55%-os teljesítménye (a GPT-4 68%-ot ért el).

Ígéretes eredmények, de ezzel maximum csak felzárkóztak a versenytársakhoz. Nem is ez teszi igazán érdekessé Grokot, hanem Musk szemlélete és a körülötte kialakult konfliktusok. A fejlesztés kimondott célja volt, hogy a Grokon alapuló chatbot szókimondó legyen, fejlesztői ne korlátozzák az érzékeny témákkal kapcsolatban sem, és akár szarkasztikus hangnemben is kommunikálhasson velünk. Grok valós időben hozzáfér az X (korábban Twitter) adataihoz is (sok országban a prémium felhasználók beszélgethetnek is vele, de az EU-ban – valószínűleg a készülő AI-szabályozás miatt - nem elérhető), így tudása naprakész, ám „véleménye” lehet részrehajló is, de nem felülről irányítottan, mint a Musk által emiatt gyakran kritizált Google Gemini.

Amit pedig a legnagyobb különbségnek tart az xAI alapítója, hogy az eredményeiket – nem úgy, mint a Microsoft támogatással fejlesztett ChatGPT-4-et – nyilvánossá is teszik. Ennek az ígéretnek megfelelően az xAI a GitHubon elérhetővé tette a Grok-1 generatív MI-chatbot alapmodelljének súlyozását és hálózati infrastruktúráját, ami jelentős lépés, főleg mivel az Apache 2.0 licensznek köszönhetően ez szabadon felhasználhatóvá is vált. Ennek ellenére valószínűleg nem várható, hogy a közeljövőben elárasztják az internetet a Grokon alapuló chatbotok, ugyanis a kiadott verzió még nincs betanítva semmilyen speciális feladatra, és a 314 milliárd paraméteres modell finomhangolása igencsak komoly erőforrásokat igényel.

Emiatt ezt a lépést sokan inkább az OpenAI felé irányzott szúrásnak minősítik, hiszen a közelmúltban a viszonyuk pereskedésig fajult. Az, hogy hová fog kifutni a konfliktus, és hogy trend-diktálóvá válhat-e a szabadfelhasználásúvá tett Grok, egyelőre még nem megállapítható, de az biztos, hogy az év hátralévő része is izgalmas lesz. Itt is, és a Láncreakcióban is biztosan lesz még szó a fejleményekről - ahogy a podcast aktuális - 151. részében is volt.

Gergely Norbert, elemző, Clementine

RÖVIDHÍR KOMMENTÁRRAL: 4 karma

Iparág: Biztosítás

A hírekben a talán a kelleténél is többet szereplő OpenAI egyik munkatársa nemrég közzétett egy jóslatot arról, hogyan leszünk tanúi a szuperintelligens AGI (általános célú mesterséges intelligencia) megvalósulásának 2026-ban.

Munkatársunkat kérdezzük, mi a véleménye a felvázolt vízióról?

LINK: https://www.reddit.com/r/singularity/comments/17telqk/openai_capabilities_team_member_gives_very/

A reddit az internet meghatározó közösségi fóruma. A létezők és nem-igazán-létezők szépen megférnek egymás mellett. Macskabéka, űrfa és a lézertojás mind - mind téma. Nem meglepő, hogy a kimondottan izgalmas és aktuális ügyeknek érdemi közössége van; így eshet meg, hogy 1,6 millió tagja van a technológiai szingularitással foglalkozó csoportnak, és egy ezrelékük jellemzően aktív. A közösségben bárki posztolhat bármilyen néven, és így tett MassiveWasabi is, aki 8.600 poszttal és 36.000 karmával (nettó kedvelésként értékelhető metrika) rendelkezik - ami azt jelzi, hogy néha egyetértenek az általa megosztott tartalmakkal.

A bejegyzés témája a GPT rendszerek idővonala, melyben az OpenAI egyik munkatársa, Daniel Kokotajlo leírja, hogy mi a GPT egy lehetséges fejlődési iránya. Röviden összefoglalva, önmagát fejlesztve 2026-ig létrehozza az általános mesterséges intelligenciát.

A Szingularitási fórum mikrokozmoszára hangolva kívántam kiértékelni a hozzászólás tudományos megalapozottságát, jövőlátásának élességét. A valós vagy vélt, valósnak vélt tudás ködén keresztül utazva, sikerült megtalálnom MassiveWasabi egy hozzászólását, ami tökéletes értékelésként, véleményként és végszóként egyaránt:

Csatlós Béla, IT Support, Clementine

RÖVIDHÍR KOMMENTÁRRAL: A ChatGPT eredetien gondolkodik?

Iparág: Biztosítás

A Montanai Egyetem partnereivel nemrég olyan kutatásban vett részt, amelynek eredménye – ha nem is sokkolta, de – meglepte a szervezőket. A végeredmény azt mutatta ugyanis, hogy a ChatGPT-4 az eredetiség tekintetében az emberiség legjobb 1%-ának felelt meg egy standard kreativitásteszten.

KOMMENT:

A teszt eredményét a kutatást vezető Dr. Guzikhoz hasonlóan én sem szeretném értelmezni. Annak azonban érdemes utánanézni, hogyan próbálja a kreativitást mérni a cikkben említett Torrance-teszt. A teszt leegyszerűsítve azt igyekszik megmutatni, hogy mennyire képes a tesztalany az úgynevezett divergens gondolkodásra. (Definíció szerint a divergens gondolkodású ember számára nincs egyetlen "jó" válasz, fantáziája és alkotóképessége segítségével lehetséges válaszok egész sorát produkálja. Képes látszólag egymástól független, össze nem tartozó elemek között kapcsolatot felfedezni, s így minőségileg valami újat teremteni.) A ChatGPT esetében persze más szavakat használnék: a gondolkodás helyett inkább azt mondanám, mennyire képes olyan válaszokat generálni, mint egy divergens módon gondolkodó ember.

Az egyes problémákra adott válaszokat 4 szempont szerint pontozzák:

Könnyedség (Fluency): az értelmes, releváns ötletek teljes száma
Rugalmasság (Flexibility): a válaszok különböző kategóriáinak száma
Eredetiség (Originality): a válaszok statisztikai ritkasága
Kidolgozottaság (Elaboration): mennyire részletes, jól kidolgozott a válasz

A ChatGPT az első és a harmadik kategóriában (Fluency, Originality) kiemelkedően jól teljesített, illetve a Flexibility eredménye sem volt gyenge. Ahogy Dr. Guzik kiemelte, az elsőre lehetett számítani, hiszen a generatív AI egyik jellemzője, hogy sok releváns választ képes generálni. Ami inkább meglepő, az az, hogy az eredetiség szempontjából is a top kategóriába került.

Mire lehet jó ez? Amire már nagyon sokan most is használják a ChatGPT-t: adott kérdésre, problémára generáltatunk rengeteg választ, és ezek közül szemezgetünk. A ChatGPT-vel ilyen módon felturbózott „kreatív munkaerő” jóval hatékonyabban tud dolgozni, mint előtte önállóan. Csak egy példa: az irodalom. Verset ugyan nem elemeztetnék vele, de egy alkotói válságban szenvedő író jól használhatja ötletgyűjtésre, hogy aztán már „csak” formába kelljen öntenie az így kapott novella- vagy regényvázlatot. Utána már csak a jogdíjakat kell egyeztetni.

Hegedüs Pál, senior elemző, Clementine

RÖVIDHÍR kommentárral: Az OpenAI ügynökei

Iparág: Biztosítás

A generatív MI legfontosabb szereplője, az OpenAI bejelentette: két, komplex feladatok elvégzésére képes MI-ügynökön dolgozik. Miért lehet fontos ez a lépés, és mi várható ezektől az MI-termékektől?

Link:

https://www.androidauthority.com/openai-ai-agent-coming-soon-3412336/

A modern számítógépeken annyi háttérfolyamat, alkalmazás, szolgáltatás fut, hogy alapvetően nem is olyan könnyű elhatárolni, hogy milyen alkalmazás számít is valójában ügynökalkalmazásnak. Ügynökeink folyamatosan futnak a háttérben, önállóan működnek, meghatározott esetekben döntenek és feladatokat hajtanak végre. Minden további bonyolítás nélkül, egyszerű példával élve, a vírusírtók ügynökalkalmazások.

Tegyünk az ügynökbe mesterséges intelligencia megoldásokat, mondja az OpenAI. A befektetők szeme felcsillan, azaz inkább vérszemet kapnak: ez lesz a következő nagy dobás, vegyétek a részvényt! Nem árt azonban óvatosnak lenni, a piac rohan, túlfűtött - a nagy nyelvi modellek jelenlegi verziói könnyen áldozatául esnek a modern korunk magas elvárásaiból eredő kihíváslabirintusnak, és elég százból egy hiba, máris megvan a szenzáció – a részvény pedig zuhan.

Ha már hírverés, a fejlesztés alatt álló OpenAI egyik ügynöke, ha elkészül, számítógépünk átvizsgálása után képes lesz feladatokat végrehajtani a nevünkben. E-mailküldés, naptárbejegyzés, sőt, számlák rögzítése a könyvelésben, fájlok másolás, adatkijelölés, -beillesztés, -keresés. Ez nagyon magas jogosultságszint engedélyezése, érdemes lesz alaposan átgondolni a használatból eredő kockázatokat. Rossz helyre megy az e-mail, vagy a stílusa nem megfelelő, adatfeltöltés esetén hiányos az adatkijelölés, a sort sajnos saját emberi hibáinkból kiindulva hosszan tudjuk folytatni.

Az angol népek mondásával élve, ezen új ügynökökkel kapcsolatos híreket egy csipet sóval érdemes fogyasztani, különösen a Google „inspirációs célt szolgáló” Gemini prezentációját követően - melyben a program képességeit úgy mutatták be, mintha léteznének, de a valóságban nincsenek, csak lehetőségek.

Skandalum!

A fenti - sikertelen - alattomos marketinghúzás, csak megerősíti azt a módszertant, hogy a mesterséges intelligencia eszközöket mindenképpen érdemes kipróbálni, azt követően pedig célszerű testreszabva üzleti folyamatokba beépíteni, mesterséges intelligencia képességekkel felruházott rendszert létrehozva.

Csatlós Béla, IT Support, Clementine

RÖVIDHÍR KOMMENTÁRRAL: GPT a munka szolgálatában

Iparág: Biztosítás

A ChatGPT-t létrehozó OpenAI kutatói egy hosszú tanulmányban próbálták megbecsülni a mesterséges intelligencia negatív hatását a munkaerőpiacra. Vajon tényleg befellegzett például a matematikusoknak, az íróknak és a könyvvizsgálóknak, vagy csak az MI félelme tápálálja ezeket a negatív várakozásokat?

KOMMENT

Az Open AI elemzése teljesen hitelesen, tudományos igényességgel mutatja be a GPT munkaerőpiaci-helyzetet befolyásoló képességét, az Amerikai Egyesült Államok munkaerőpiacára vetítve. Egy mondatban összefoglalva (nem, nem Chat GPT segítségével), a magas hozzáadott értékkel rendelkező szellemi munkákat elképesztően hatékonyan képes segíteni a GPT.

A GPT leginkább olyan, mint egy szuperokos játékos adatkutya. Bármit kérdezhetsz tőle, MINDENT megtanult, de nem érti, mit miért, nincs itt ok-okozat, azért adja válaszul, amit mond, mert az a legjobb válasz. Teszi ezt kedvesen, és ha hibázik, és segítünk rajta, akkor van esély arra, hogy jó választ ad, és ha ez a „kutyával való játék”, gyorsabb tud lenni, mint az internetes keresés, és tényleg megoldja a problémát, hovatovább költséghatékony is, akkor van piaci értéke.

Az adatkutyákhoz nem értő emberen nem segít, de a kutya szeret játszani, és könnyen bevon a játékba. Sokan játékosan használják a GPT alkalmazásokat és nem tovább, a felhasználók egy része azonban megtalálja a helyét a saját munkavégzésében.

Marketing, gamifikáció jeles!

Tervben van a GPT 5 nevű modell, de előtte a GPT 4 tematikus hangolása történik, ami mellett egyre inkább a minőségi adatforrások felhasználása felé fordul a modellépítés, és nem a méret felé.

Tematikus hangolás, minőségi adat. Ez egy hatalmas munka, és működőképesen kivitelezve megdöbbentően hatékony speciális alkalmazást kapunk.

Valami még azonban hiányzik.

Van egy MI felé bizalmat építő elvárás, aminek semmilyen szinten nem felel meg a GPT, az pedig a magyarázhatóság. Ha ez valahogy belekerül, azaz jól válaszol nekünk és a legrelevánsabb adatforrást is képes csatolni a válaszához, mintegy magyarázatképp, akkor már nem adatkutya, hanem új generációs asszisztens. Aminek az égvilágon semmi köze a generális mesterséges intelligenciához, hanem egy elképesztően erős speciális MI támogató megoldás. Sokakat meggyőzne ez az új képesség, és az EU MI irányelveknek megfelelést is elképesztően megkönnyítené.

Addig meg marad a felügyeletet igénylő, okos társ, a GPT 4.

RÖVIDHÍR KOMMENTÁRRAL: GPT a munka szolgálatában

adatkutya animáció copyright Sunrise Inc.

Csatlós Béla, IT Support, Clementine

Rövidhír kommentárral: Már mindenféle munkát elvesznek a robotok?

Iparág: Biztosítás

Az Amazon bemutatta legújabb robotját, Sparrow-t. De vajon tényleg annyira különleges, szenzációs ez a szerkezet, ahogy azt a cég állítja?

Komment:

Mindig izgalmas nyomon követni az Amazon fejlesztéseit, hiszen azok iránymutatók lehetnek az egész világ számára. Azt hiszem, kevesen vitatnák, hogy az Amazon a leginnovatívabb cégek közé tartozik, ennek eredményeként lett egy „kis” online könyvesboltból mára a világ egyik legértékesebb vállalata. A webáruháza meghatározó értékesítési platformmá vált: az Amazon Web Services-t használja a CIA és a NASA is, az utóbbi években pedig streaming szolgáltatóként és tartalomgyártóként is felzárkózott a legnagyobbak közé. Mindez nem valósulhatott volna meg, ha a raktárai és csomagküldő szolgáltatása nem lenne ennyire hatékony, ezt pedig az olyan fejlesztéseiknek köszönheti, mint Sparrow, aki nem az első az Amazonnál munkába álló robotok közül.

A KIVA robotikai vállalat 2012-es felvásárlása óta sikeresen alkalmazzák - többek között - a csomagok szortírozását segítő, Robin névre keresztelt AI vezérelt robotkart, és Proteust is, aki egy óriás robotporszívóra hasonlító, teljesen „szabadon” és önállóan mozgó szállító egységként érzékeli a környezetét, alkalmazkodik a körülötte lévő emberek mozgásához és a töltőjéhez is visszatalál.

Sparrow újdonsága, hogy szenzorainak és fejlett mesterséges intelligenciájának hála, képes felismerni és a megfelelő helyre továbbítani a még nem csomagolt termékeket is, ezzel egy újabb munkafolyamatba léptetve be a robotokat. Összességében már több mint 520 000 robotegység végzi a munkáját az Amazonnál, és a vezérlésüket biztosító mesterséges intelligencia is folyamatosan fejlődik: egyre összetettebb neurális hálókat és machine learning algoritmusokat hoznak létre a cég fejlesztői.

Na de elveszik-e ezzel a munkát az emberektől? Az Amazon szerint nem, nyilatkozataik szerint a robotok célja a humán munkaerő segítése, nem pedig a kiváltása. Első sorban veszélyes és/vagy fáradságos munkafolyamatokat bíznak a robotokra, összességében pedig a hatékonyság növelésének és a volumenek növekedésének köszönhetően az elmúlt évtizedben milliós nagyságrendben keletkeztek új munkahelyek a cégnél és több mint 700 féle új munkakör jött létre, amihez többek között a robotizációnak is hozzájárult, így cégszinten mindenképpen védhető az állítás, miszerint a munka nem vész el, csak átalakul.

Gergely Norbert, Elemző, Clementine

RÖVIDHÍR KOMMENTÁRRAL: Mesterséges intelligencia jövőkép Sam Altman tollából

Iparág: Biztosítás

A világsikerű ChatGPT készítője, az OpenAI közzétette terveit: hogyan képzeli el az MI-fejlesztések társadalomba történő integrációját. Vajon disztópia vagy utópia vár ránk, ha az általános célú mesterséges intelligencia (AGI) megjelenik?
Az OpenAI írásáról kértük ki szakemberünk véleményét.

KOMMENT

Sam Altman egy elképesztően sikeres tech-életművész, egyáltalán nem olyan hangos és csapkodó, mint Elon Musk, de nem kevésbé minden lében kanál. Sikeres befektető, az a nagy tüdővel lufit fújó fajta, varázslatos gondolatokkal, hogy évi 1000 technológiai céget alapít – tíz éve mondta ezt. Voltaképpen nem érdekes, hogy tartja-e az ígéretét, mivel nincs egyedül ezen hozzáállásával, így az a helyzet, hogy 2022-re több mint 500.000 technológiai cég van az USA-ban, olyan 2 ezer milliárd dollár becsült értékkel. (Minden 670 amerikai állampolgárra jut egy tech cég.) A becsült érték részvényárakat jelent, sokszor jelentős részben technológiába vetett hit, illetve márka függőségből eredő fanatizmusok által fűtve. A hype és az elvárások olyan magasak, hogy a fundamentumok néha teljesen lényegtelenné válnak, melyek összeomláshoz, pánikszerű viselkedésekhez vezethetnek.

A szektor zászlójára van tűzve a diszruptív technológiai előtörés, de ha egy tech óriás hamarabb lép mint a másik, a lemaradók belekóstolnak a rohamos változásból eredő káosz feketelevesébe.

Nem lehet nem tovább nézni a cikk írójának életét, aki egyaránt foglalkozik kriptopénzekkel, atomenergiával, és ígérete szerint politikai pályát is tervezett, amitől visszalépett.

Altman kimondottan sokat látott ember. Cégvezérként tollat ragad és chartát ír (a politikus nem alszik) arról, hogy a mesterséges intelligencia technológia közeledik a generális intelligenciához. Az OpenAI óvatos és nem akar senkit hátrányba hozni. Nagy a veszély. A generális intelligenciához vezető út lassú, de a vége elképesztően felgyorsul. Az embereket, a társadalmat fel kell készíteni a hatásaira.

Kár, hogy nem lett politikus, jól megy neki a megtévesztés. A ChatGPT példája mutatja, hogy a tech szektor egy szereplőjének sikere olyan földrengést okozott, hogy a szektorban hirtelen kapkodás, csalódást keltő béta bemutatók, nyerészkedés ütötte fel a fejét. A társadalom többsége ugyanekkor változatlanul, távolról szemlélte a szektor káoszát.

Nem tudni, hogy milyen piaci környezetben és mikor fog bekopogtatni az általános mesterséges intelligencia, de mivel a cikk állításainak túlnyomó többsége igaz, abból levezethető, hogy ha kész a generál intelligencia első verziója, onnan az előrelépés, a domain specifikus verziók elsősorban CPU időt és nem hagyományosan értelmezett időt igényelnek, napok alatt évszázadnyi mértékben léphetünk előre. Piaci előnye lenne -e az annak, aki először éri el a generális mesterséges intelligenciát? Hogy hatna ez a többiekre, akik ezen a területen hónapokkal, évekkel vannak elmaradva? Sokféle válasz van, az enyém az, hogy: A piac majd beárazza! (A világtőzsde története valószínűsíti, hogy a piac teljességgel igazodik* az OpenAI chartájához)

*OpenAI charta szellemiséghez teljességgel igazodó tech-bróker

Csatlós Béla, Clementine, IT Support

RÖVIDHÍR KOMMENTÁRRAL: Mesterségesen tökéletlen

Iparág: Biztosítás

A gépek lázadásahelyett az emberek lázadása: a Disney új Marvel-sorozatán akadt ki a rajongók és a művészek egy hangos csoportja. A Secret Invasion bevezető képsorait ugyanis AI-val alkotta meg a cég, és ezt nehezményezik sokan elég vehemensen.

Link: https://www.msn.com/en-gb/entertainment/movies/secret-invasion-marvel-faces-backlash-from-artists-and-fans-over-ai-generated-opening-sequence/ar-AA1cRrRp

KOMMENT:

Keszekusza projektek, szoros határidők, szűkülő pénzügyi keret, megbukott nagyfilmek, csökkenő streamingprofit. Sőt! Lázadó forgatókönyvírók. A Disney Stúdió eseménydús elmúlt negyedéve távirati stílusban.

A Titkos Invázió című sorozat részben ezen viharos környezetben készült. A műfaja sci-fi, fő témája pedig az idegen, fejlett alakváltó faj konspiratív tevékenysége; cél a háttérhatalom kialakítása és végső soron a világuralom megszerzése. Az alapötlet egy sablon, az elkészült tartalom minősége átlag alatti.

A könyvek és borítójuk összefüggését elemző népi bölcsesség alkalmazható a film és bevezető képsor párosára, a változókat a közmondásba helyezve: lehet, hogy rossz a film, de ettől függetlenül lehet jó a bevezetője. A Titkos Invázió bevezetőjének motívumai: sejtelmes humán, de zöldes alakok, USA, Fehér Ház, alakváltásra emlékeztető humán arctorzulások.

A bevezetőnek nem az a hibája, hogy mesterséges intelligencia segítségével készült, hanem az, hogy professzionális célra, igénytelenül használták fel a csúcstechnológiát képviselő mesterséges intelligencia megoldást, továbbá megbocsátatlan módon a Disney digitális adatvagyon és művészeti tapasztalat teljes figyelmen kívül hagyásával.

Hogyan lehet beépíteni a vállalati tudást és tartalmat a generatív megoldásokba? Ha megfigyeltük a GPT technológiai körüli nyüzsgést, az IBM távol tartotta magát a kommercializált MI hype profit skalpolástól, a nagyvállalati megoldásra fókuszált, ami a WatsonX.

A WatsonX a vállalati adatvagyonra építve, hoz létre generatív MI megoldásokat.

A sikeres MARVEL – Mi lenne, ha…? sorozat témájával élve, vizsgáljuk meg, hogy mi lett volna, ha a Method Studios az IBM WatsonX megoldást használta volna.

Általános generatív MI	What if… WatsonX
homályos zöld alakok	éles, 4K minőségű skrull-ok (idegen lények)
ácsorgó alakok	dinamikus mozgóképek montázsa
mindenféle kontextus hiánya	20 évnyi előzmény alkalmazási lehetősége
kizárólag a főszereplő bemutatása	szereplői gárda bemutatási lehetősége
internetre kihelyezett minimális saját jogvédett tartalom képezi a modell alapját	a saját teljes releváns adatvagyon bevonható
??? (rendezett adatvagyon hiányában értelmezhetetlen)	kameraállás beállítási, vágási, rendezői stílusok alkalmazási lehetősége, adatvagyon alapján (nézd már, pont olyan mintha Stan Lee álmodta volna meg)

A fenti összehasonlítás magáért beszél.

Kedves Ali Selim! Nincs magára hagyva az MI hatékony felhasználásával kapcsolatos kihívások legyőzésében. Baráti jó tanács: Call IBM USA. (1-800-426-4968)

RÖVIDHÍR KOMMENTÁRRAL: MI jog dióhéjban, és a MI jog diófája

Iparág: Biztosítás

Egy jogi összefoglaló azt próbálja körüljárni, hogy a szerzői jogban mi vonatkozik a mesterséges intelligencia által, vagy annak segítségével készült képekre.

LINK:https://arsboni.hu/a-mesterseges-intelligencia-altal-generalt-kepek-jogi-keretei-korunk-muveszeteben/

KOMMENT

Az Absoni gyakornoki programjának keretében született cikk egy kiváló összegzése az MI szerzői joggal kapcsolatos tudnivalóknak: kötelező olvasmány.

A jövőkép boncolgatása nem volt a cikk fókusza, pedig izgalmas vetülete van. Az EU által immáron több éve készített mesterséges intelligencia szabályozó tervezete elérhető. Egy éve azt mondta volna mindenki, hogy minden a terv szerint megy, időre kész lesz, aztán a folyamatban lévő munka ütemezését úgy borította fel a GPT technológia sikere, mint traktor a bakterházat.

Az EU transzparens, etikus, magyarázható mesterséges intelligenciát szeretne a kontinensen bevezetni, amelyet minél kritikusabb területen alkalmaznak, annál magasabb elvárásoknak kell megfelelnie. Ha valami újszerű és sehogy nem felel meg a fenti kritériumrendszernek, azt fejlesztői sandboxokba zárják.

A sandbox- és transzparencia-korlát jelentősen letöri a cash – grab versenyképességet Kínával és az USÁ-val szemben, ezt kár vitatni: tény. Mit értek ez alatt?

Kína – napjainkban:

Állami tulajdonú, zártláncú kamerarendszerek adatainak felhasználása olyan természetességgel képezi mesterséges intelligencia rendszerek tanító adatbázisainak alapját, amilyen természetességgel van tiltva az EU-ban.

USA – etikus MI fejlesztői megbeszélés:

Főnök, felmerült itt egy kérdés, a tanító adatbázisba belekerültek élő személyek alkotásai, nagy számosságban, mit kezdjünk a problémával?
Nem problémaaa! Funkció! Tudjon a rendszer élő személyek stílusában alkotni!
Nem lesz ebből gond, főnök?
Elnézést kérni könnyebb, mint engedélyt.

Az EU szabályoknak megfelelés és sandbox hosszú távon mit jelent? Ha a fejlesztőt nem lehetetleníti el a globalizált piacból eredő digitális gyarmatosítás, az EU szabályoknak megfelelő modellek tanító adatbázisa teljességgel transzparens lesz. Ez lehetőséget nyújt arra, hogy a finomhangolás legvégső fázisában a termék jobb legyen, mint a nem-EU-konform versenytársé. De ez nagyon időigényes, és a nem áttekinthető, tanító bázisú modellek finomhangolása is nagyon hatékony megoldás. Sőt folyamatban is van: a GPT 5 előtt a GPT 4 finomhangolt tematizált alverziói jönnek.

Pezseg az MI szcéna, a kommercializált nyelvi modellek világát éljük, követhetetlen mennyiségű startup, ígéret, alkalmazás.

Nem csak fejlődünk, hanem felnövünk is: lassan érkeznek a nagyvállalati igényeknek megfelelő nyelvi modell termékek is (watsonx.ai), amelyek jól beállítva ugyanarra a kérdésre, remélhetőleg ugyanazt a választ adják.

Elkalandozva, de újra csatlakozva a kezdő gondolathoz, mégis mi tekinthető műnek: State-of-the-Art ipari hatékonysági szintű termelőeszközzel hozunk létre tartalmat. Álláspontom szerint már az eszköz használat adja a művészeti potenciált. Látensen közeleg a jogi tényállás is, amikor is egy hype kapcsán elkészül az „első” százkilencvenhétezer-nyolcszázötvennyolc plusz háromszázhét per másodperc egyforma alkotás, mind eredetiséget követelve.

Csatlós Béla, IT Support, Clementine

RÖVIDHÍR KOMMENTÁRRAL: Most akkor segítsenek a gépek vagy hagyjanak minket békén?

Iparág: Biztosítás

Csak kapkodjuk a fejünket: a ChatGPT és a többi generatív AI tényleg elveszi a munkát? Vajon állás-Armageddon vagy lezser utópia elé nézünk? A sokak számára fejbekólintóan jó hírt jelentő realitással Alex Kantrowitz újságíró tálalja, szakemberünk pedig kommentálja a cikket.

LINK: https://www.businessinsider.com/chatgpt-isnt-good-enough-to-take-jobs-unlikely-mass-layoffs-2023-8

A mesterséges intelligencia elveszi a munkahelyeket hangzik a vissza-visszatérő számomra már rémesen unalmas aggodalmaskodás. Egyrészről izgatottan várjuk és óhajtjuk a gépek segítségét, hogy ne kelljen olyan sokat dolgoznunk, de amint felvillan a remény, rögtön eláraszt a kétely bennünket. Mi lesz velünk, ha már nem szükséges az emberi munkaerő?

Amikor a MI témakörben gondolkodom, nem tudom figyelmen kívül hagyni azt a tényt, hogy meglepően sok nagy cég (nyilván még több kisebb) még ma is legalább részben manuálisan dolgozza fel az adatait (ha egyáltalán bárhogy), excel táblákban kézzel szűrnek, másolnak, törölnek és beírogatnak (bármennyire is hihetetlen ez a chatGPT korában) és nem a legmodernebb digitalizációs, automatizációs lehetőségekkel élve dolgoznak. Az automatizálásra régóta van számtalan lehetőség, mégis nagyon sok helyen mindez csak nagyon lassan változik. És akkor hol van még ehhez képest a mesterséges intelligencia?

A világjárvány hatására bekövetkező ugrásszerű digitalizációs fejlődés is azt mutatta, hogy a technológia rendelkezésre állása önmagában nem elegendő ahhoz, hogy az államok és a vállalatok azonnal áttérjenek az új módszerekre. Valami olyan válságra vagy külső hatásra van gyakran szükség, ami rákényszerít a változásra. Sokszor csak egy hirtelen és elkerülhetetlenül felmerülő igény az, ami rávehet szélesebb köröket olyan fejlesztésekre, amelyeket korábban hosszú időn keresztül halogattak.

Egy másik eshetőség is előfordulhat: lehetséges, hogy egyesek átugorják majd a kódokkal való automatizálás lépését és olyan gépekkel kezdenek dolgozni rögtön, amelyek emberi nyelven kommunikálnak és így szintet ugranak? Ez nem is olyan elképzelhetetlen jelenleg, amikor már itt van a technológia, aminek a használatához nem kell “számítógépnyelvet” (programozást) tanulni, csak az emberi nyelvet kell megfelelően csűrni-csavarni, hogy a kívánt eredményt kapjuk.

De ahogy a fenti cikk is írja, sokrétű és hosszabb folyamat lesz az, amíg az MI elveszik a munkánkat, nem megy egyik napról a másikra. Ha félti valaki a munkahelyét a gépektől, szerintem fontos, hogy ne megrémüljön a chatGPT-től és társaitól és hallani se akarjon róluk, hanem azonnal kezdje el használni, mindenre amire csak eszébe jut és ha sikerül minél jobban kitanulni és kiaknázni a benne rejlő lehetőségeket, akkor ő lehet az a hatékonyabb munkatárs, akinek biztos nem kell félnie attól, hogy egy gép elveszi a munkáját. Aki lemarad és görcsösen kapaszkodik a manuális favágó feladataihoz, annak szerintem valóban van miért aggódnia hosszabb távon.

És a végére egy jolly joker tipp: tanuld meg ügyesebben használni a chatGPT-t, mint ahogy a főnököd tudja, hogy jobban járjon azzal, ha téged kér meg valamire, mintha a chatGPT-t kérné meg. ;)

Zsilinszki Anna, elemző, Clementine

RÖVIDHÍR KOMMENTÁRRAL: Virtuális szeméthegyek

Iparág: Biztosítás

Egy új kutatás aggasztónak találja, hogy a netet elárasztják a rossz minőségű fordítások – és ez később a nagy nyelvi rendszerek szövegképzésére, teljesítményére lehetnek negatív hatással. Mit mond erre kollégánk? Az alábbi véleménycikkből kiderül.

Link:

https://www.vice.com/en/article/y3w4gw/a-shocking-amount-of-the-web-is-already-ai-translated-trash-scientists-determine

Létezik “First World problem” a harmadik világban? Úgy tűnik igen. Szemetes az internet, hogy lesz így jó generatív AI Afrikában? Nem akarom elbagatellizálni az ügyet, de miért is olyan nagy baj ez? Úgyis csak a munkánkat veszi el az AI, nem? Vegye el az övéket is?

Számomra azért kicsit ironikus ez a problémafelvetés, mert ezekben az országokban vannak ennél sokkal nagyobb gondok is. Maradva a fenti témakörnél, az autentikus tartalom hiánya az interneten nem csupán a generatív AI fejlődését gátolja. Sokkal fontosabb aspektusa a dolognak az, hogy az emberek számára korlátozza a megfelelő információkhoz való hozzáférést. Generatív AI nélkül elég jól túléltünk eddig is. Az egyszeri internetező számára sokkal valósabb probléma az, ha nem talál megfelelő minőségű tartalmakat a saját nyelvén, vagy az, ha félrefordított szöveget vél igaznak. További fejtörést okozhat még, ha a gépek segítségével hatalmas mennyiségben előállított dezinformációs tartalmakat fogyaszt valaki, vagy ha szintén a gépi fordítás közreműködésével létrehozott hamis webshopokban csalás áldozatává válik és még sorolhatnánk. Nem újkeletű a jelenség. A Google által fordított weboldalak, cikkek, blogbejegyzések már hosszú évek óta velünk vannak. Ha például magyarul rákeresünk egy egészségügyi témára, rengeteg igénytelen tartalom fog elárasztani bennünket, nagyon sok esetben ugyanaz a gyanúsan fordítózás-szagú szöveg számtalan weboldalon szó szerint ismétlődve. A szakavatatlan olvasóban azt a hamis érzetet keltheti, hogy jó alaposan utánajárt egy témának, és lámcsak mindenütt ugyanazt írják, akkor bizonyára megalapozott, hogy a gyömbér gyógyítja a vastagbélrákot. Hasra ütöttem a példához, majd rákerestem és lássatok csodát, a gyömbér tényleg gyógyítja a vastagbélrákot az internet szerint. Ez a fajta igénytelen internetes “újságírás” már régóta jelen van, egyre nagyobb méreteket ölt és egyre nehezebb észrevenni.

Viszont, ha a cikkben taglalt probléma megoldódik, és lehetővé válik a generatív AI megfelelő tanítása ezeken a nyelveken is, azzal azt is garantáljuk, hogy ha eddig gépi fordított szövegekkel volt elárasztva az internet, akkor onnantól árad majd a teljesen gép által generált szöveg is, így még nagyobb mértékben lesz robotgyártott minden az interneten. Ez viszont már komoly gond, nem csak ezekben az országokban, hanem az egész világon. A megoldás pedig még várat magára.

Az AI ipar résztvevői által felvázolt megoldási irány jelenleg az, hogy világossá kell tenni az olvasók számára, hogy ki vagy mi áll az adott tartalom mögött, legyen szó akár szövegekről, képekről vagy videókról. Elérhetőek ugyan jelenleg is olyan AI detektorok, melyek elvileg megmondják, hogy egy szöveget ember írt-e, vagy gép, de azt hiszem, ezeknek a működése egyre kevésbé lesz megbízható, ahogy fejlődnek ezek a technológiák. A szerzőmegjelölés egyébként sosem volt erőssége az internetnek, és amíg olyan oldalak működnek, ahol mindenféle személyazonosság igazolása nélkül lehet regisztrálni, majd tartalmakat megosztani tömegével, addig hogyan is lehetne szankcionálni bármi ilyesmit? Valahogy viszont muszáj megoldást találni, mert teljes káosz lesz itt hamarosan (vagyis már az van). Deepfake pornó akárkiről, végtelen variációja a megtévesztésnek, a hamisított bizonyítékoknak és a lejáratásnak. Mindemellett várható a valódi bizonyítékok elértéktelenedése is, mert bárki mondhatja majd, hogy egy adott felvétel nem igazi, ha a hamisítás általánossá válik.

A fenti problémákkal tisztában vannak a techóriások is (akik kiengedték a szellemet a palackból) és éppen az elmúlt pár napban írtak alá egy paktumot a témában. Ebben megígérik, hogy igyekeznek erőfeszítéseket tenni arra vonatkozóan, hogy minél gyorsabban és szélesebb körben elterjedjen az a technológia, ami megbízhatóan kiszűri és jelöli a géppel generált tartalmakat. Szkeptikus vagyok a sikert illetően. De ha meglesz a jelölés, ki lehetne terjeszteni a fordítózott szövegekre is, ezzel pedig megoldódna a cikkben taglalt probléma.

Akkor viszont valószínűleg nem lesz elég szöveg a tanításhoz, így ugyanúgy nem lesz jó a generatív AI adott nyelven, de legalább sok más komoly problémára lesz megoldás.

Zsilinszki Anna, elemző, Clementine

Ügynökök a te érdekedben: az MI Agent

Iparág: Biztosítás

A Bloomberg nemrég kiszivárogtatta, hogy a több szempontból is iparágivezetőnek számító amerikai OpenAI belső használatra összeállította az általános mesterséges intelligencia általa vélt szintjeit. Szerintük még csak az elsőnél tartunk, de mostani cikkünk szempontjából ennél érdekesebb a 3. szint: ide az Agentek kerültek, amelyek tulajdonképpen „akcióra kész rendszerek”. Nem kell megijedni, ez még mindig nem Smith Agent, vagyis Smith ügynök a Mátrixból – annál inkább egy önállóan cselekedni képes szoftver vagy algoritmus. Ráadásul, úgy tűnik, az első fecskék már megjelentek.

Mit tud az Agent?

Önállóan érzékeli a környezetét, adatokat gyűjt, és ezen adatok alapján döntéseket hoz a kitűzött célok elérése érdekében.

Egy Agent működése három alapvető lépésre bontható: érzékelés, döntéshozatal és cselekvés. Az Agent érzékeli a környezetét különféle interfészek segítségével, amelyek lehetnek fizikaiak (pl. szenzorok) vagy szoftveresek (pl. API-k). Az adatok elemzésével az Agent kiválasztja a legmegfelelőbb tevékenységeket, hogy elérje az előre meghatározott célokat. Végül, végrehajtja a döntéseken alapuló feladatokat, és folyamatosan értékeli, hogy mennyire sikerült elérnie a célokat, szükség esetén korrigálva az elvégzendő teendőket.

Előnyök és veszélyek

Az Agentek előnyei számos területen megmutatkoznak. Az általános vélekedés szerint az automatizálás révén növelik a produktivitást, mivel az emberek helyett automatizált rendszerek végzik el az unalmas és ismétlődő feladatokat. Ezáltal az emberi munkavállalók inkább a kreatív és stratégiai feladatokra fókuszálhatnak, amelyek több értéket hoznak a szervezet számára. Az Agentek emellett csökkentik a működési költségeket azáltal, hogy minimalizálják az emberi hibákból adódó kiadásokat és a folyamat kevésbé hatékony részeit. Ezek természetesen az optimista szcenáriók, mivel alapvetően nem számolnak azzal, hogy az Agentek elterjedésével előfordulhat, hogy a vállalatoknak jóval kevesebb emberre lesz szükségük (ez történt a gyárak esetében is).

Az egyik terület, amelyen áttörést várnak az Agentektől, az ügyfélszolgálat. Ha ugyanis egy vállalat ügyfélszolgálatán MI Agent tevékenykedik, akkor az képes a rendkívül szerteágazó és – sok esetben – az emberek számára hatalmas tudást igénylő információkat gyorsan megadni. Önállóan kereshet a cég tudás- és adatbázisában, ha pedig mégsem találja a helyes választ, még mindig továbbkapcsolhatja az ügyfelet egy emberhez. Ez a folyamat– amennyiben megvalósul – jókora terhet vesz le a munkatársak válláról.

A megoldandó kérdések az Agentek körül először is technikaiak: a cikk elején említett MI-besorolás szerint sem vagyunk még ott, hogy ezek biztonságosan és jól használhatók legyenek. Ezen kívül meg kell oldani a velük kapcsolatos etikai, adatkezelési kérdéseket is.

Példák Agentekre

Az előzőekben felsorolt akadályok ellenére Agent-szerű szolgáltatások, algoritmusok már ma is léteznek. Vállalati szinten idetartozik például az Amazon Connect Contact Lens, amely az ügyfelek beszélgetéseit már hívás közben elemzi és automatikusan kiértékeli az interakciókat, miközben akár érzékeny adatokat is törölhet.

A 2023-ban bemutatott Auto-GPT a Significant Gravitas nevű videojáték-cég vezetőfejlesztőjének, Toran Bruce Richardsnak az Agentje. Ennek a nyílt forráskódú, GPT-4 és a GPT-3.5 modelljét használó szoftvernek az az előnye, hogy a komplexebb feladatokat kisebb darabokra bontva végzi el. Tipikus felhasználási területe a kódírás nulláról, piackutatás, befektetés elemzése vagy termékismertetők megírása. A neten önállóan kutat információk után, ha szükségesnek látja. Az Auto-GPT természetesen nem tökéletes. Annak ellenére, hogy az egyik legtöbbre tartott megoldásról van szó, még sokszor előfordul, hogy hallucinál vagy végtelen loopba kerül.

Az elsősorban webkereskedelmet támogató amerikai szoftveróriás, a Salesforce nemrég jelentette be saját Agentjét. Az Einstein Service Agentnevű chatbot a cég ígérete szerint MI alapú párbeszédes felületet biztosít a végfelhasználók számára. Önkiszolgáló élményt nyújt, mivel olyan dolgokat is képes elintézni, mint például a termékvisszaküldés vagy a visszatérítés. Integrálták az ügyféladatokkal és a hivatalos munkafolyamatokkal, ezzel az elmúlt 25 év céges tudásával is felvértezték.

Persze nem árt az óvatosság! Idén februárban jött a hír, hogy az Air Canadát megbüntették a chatbotja miatt. Az MI-eszköz ugyanis olyan kedvezményt ígért egy utasnak, amely akkor és olyan formában nem létezett. A légitársaság szerint a chatbot tévedett, de – és ez benne az érdekes – a cég úgy érvelt, hogy „a chatbot külön jogi személy, amely saját tetteiért felelős”. Az Air Canada szerint a pert kezdeményező utasnak a chatbot által biztosított linkre kellett volna mennie, ahol látta volna a helyes irányelvet. Az eset mérföldkőnek számít (a cégek felelősek azért, amit technológiájuk mond vagy tesz, bármennyire is fejlett), ezért az Agentek fejlesztésénél, használatánál az odafigyelés egyelőre erősen indokolt.

Úton a Skynet felé: MI a hadviselésben

Iparág: Biztosítás

Amikor szóba kerül a a hadviselés és mesterséges intelligencia kapcsolata, az átlagember leginkább a filmes élményeire tud hagyatkozni. Ezek közül is előkelő helyen áll a gyilkos robotok toposza, nem beszélve a Terminátor-univerzum emberiséget majdnem kipusztító Skynetjéről. Ez a fikció – de mi a valóság?

Fegyverbe, világ!

Ma a mesterséges intelligencia a hadviselés egyre több területén jelenik meg. Régen például nem létezett kibervédelem vagy űrhaderő (amelyet például az USA-ban csak 2019-ben hoztak létre). A katonaság által használt MI-eszközök piaca is folyamatosan növekszik: A Vantage Market Research riportja úgy becsüli, hogy a 2022-es 6,76 milliárd dolláros forgalom 2030-ra 17,6 milliárdosra hízhat. Sajnos a geopolitikai érdekek, a folyamatosan erősödő új hidegháborús – egyelőre – technológiai versenyfutás, Oroszország inváziója rengeteg országot, sőt, az öreg kontinenst tekintve egy egész régiót hadikiadásai és -fejlesztései átgondolására késztetett. Magyarán: újra (fel)fegyverkezik a világ, és ebben a mesterséges intelligenciának jelentős szerepet szánnak.

Hogyan használják az MI-t a hadviselésben?

Íme néhány terület, ahol a mesterséges intelligenciát segítségül hívják:

Hírszerzés, megfigyelés és felderítés (ISR). A számítógépes látás a mesterséges intelligencia egyik fontos részterülete. Az ilyen képességgel rendelkező rendszerek sokkal hatékonyabbak objektumfelismerésben (emberek, fegyverrendszerek, nagy értékű célpontok esetében) az embernél, hiszen fényképek, videók, szövegek millióit képesek gyorsan és pontosan átfésülni, lényegesen kevesebb idő alatt.

Az amerikai hadsereg egyik beszállítója 2023 áprilisában mutatta be a Raiven mesterséges intelligenciával működő elektro-optikai érzékelőt, , amely hiperspektrális képalkotást és fényérzékelést (LiDAR) használ, így lehetővé teszi a repülőgép személyzete számára, hogy akár ötször messzebbre lássanak, mint a hagyományos képalkotással.

Háborús harci rendszerek. Egy összetett, több fegyvernemre kiterjedő (például légi és földi, esetleg kibertérben zajló) hadműveletben rengeteg adat keletkezik. E komplex adatok befogadása, folyamatokká alakítása, parancsnoki döntési helyzetbe való eljuttatása szintén hatékonyabb MI-vel.

Légvédelmi/rakétaelhárító rendszerek. Már a második világháború alatt azért fejlesztette ki az amerikai katonaság az ENIAC számítógépet, hogy ballisztikus pályákat számítsanak gyorsabban, mint bármikor előtte. A jelenlegi orosz-ukrán háborúban látjuk először a drónok harctéri, csoportos, rajban közlekedő használatát. E fenyegetés megszervezésére vagy épp leküzdésére a sok célpontot beazonosító MI-rendszerek tökéletesek. A tüzérség felértékelődését hozó ukrajnai konfliktus csak megerősíti a mesterséges intelligencia ilyen célú meglétét.

Kiberbiztonság.Az MI-vezérelt kibervédelmi rendszerekkel a speciális támadások és a kiberfegyverek jellegét rövid időn belül meg lehet határozni, és a megfelelő védelmi szoftverkódot pillanatok alatt online lehet telepíteni. (Sőt, az újabb generatív MI-k egyre ügyesebben kódolnak.) Az emberek szerepe ebben a folyamatban is jelentősen lecsökken.

Képzés/szimuláció. A katonai személyzetet nagyon nehéz felkészíteni arra, hogy bármilyen szituációban helytálljanak. A katonai szimulációs iparág az elmúlt néhány évben gyorsan fejlődött az olyan fejlett technológiák térnyerésével, mint a mesterséges intelligencia, a kiterjesztett valóság/vizuális valóság (AR/VR) és a gépi tanulás. Ezek a technológiák forradalmasították a katonai szimulációkat, realisztikusabb, magával ragadóbb és hatékonyabb kiképzési élményt nyújtva a katonák számára.

Az MI egyik legfontosabb előnye a katonai szimulációkban az, hogy dinamikusabb és kiszámíthatatlanabb forgatókönyveket tesz lehetővé. Az MI-alapú szimulációk képesek alkalmazkodni a változó helyzetekhez, és reagálni az egyes katonák cselekedeteire, így valósághűbb és nagyobb kihívást jelentő kiképzési környezetet biztosítanak. Az MI segíthet azonosítani azokat a területeket is, ahol a katonáknak további képzésre vagy támogatásra lehet szükségük, lehetővé téve a célzottabb és hatékonyabb képzési programok megvalósítását. Logisztika. Bármennyire is high-tech lesz a háború, a nap végén mindig kritikus marad, hogy a megfelelő katonai eszközöket időben a pontos helyre juttassák. A modern katonai műveletek összetettsége és nagyságrendje azonban jelentős kihívások elé állítja a logisztikai tervezőket és üzemeltetőket. Az MI-alapú analitika optimalizálhatja az ellátási láncot a kereslet előrejelzésével, az ellátási lánc kockázatainak azonosításával és a készletszintek optimalizálásával. Az algoritmusok képesek elemezni a múltbeli adatokat, a különböző érzékelőkből származó információt és a külső tényezőket, így pontos keresleti előrejelzéseket hozhatnak létre. A kritikus erőforrásokhoz való jobb hozzáférés és a csökkentett állásidő révén pedig a katonai egységek magas szintű műveleti készenlétet tarthatnak fenn.Karbantartás. A prediktív karbantartás már régóta ismert fogalom: elemzik a szenzorokból származó adatokat és a berendezések teljesítményének mérőszámait, hogy a lehetséges meghibásodásokat jelezzék, még mielőtt azok bekövetkeznének. A karbantartási igények proaktív azonosításával az MI-rendszerek csökkenthetik az állásidőt, meghosszabbíthatják az eszközök életciklusát és optimalizálhatják a karbantartási ütemterveket. Az Egyesült Államok Légiereje például a C3.ai cég MI megoldásáthasználja, hogy megjósolják: mikor fog egy repülőgép, vagy annak egyik fontos alkatrésze karbantartást igényelni.

Deepfake, propaganda. Először az ukrajnai, majd az izraeli-Hamasz-háborúban láthattuk az új, generatív MI alkalmazását. A 2022. február 24-i ukrajnai invázió megindulása után már kijött az első hamisított videó, melyben Zelenszkij elnök arra kérte csapatait, hogy tegyék le a fegyvert. De ugyancsak róla készült egy kokainozós videó is (erősítve a Kreml „drogos ukrán elnök” narratíváját), és 2023 novemberében kapott egy álvideót az akkori ukrán főparancsnok, Zsaliznij is, melyben a katona az „állam ellenségének” titulálta Zelenszkijt.

A háború eszközei

Természetesen a nagy- és középhatalmak többsége már most igyekszik MI-megoldásokat fejleszteni és használni. Figyelemreméltó például az amerikai, Tomahawk robotrepülőgépéről ismert Raytheon cég EQUAS (Explainable Question Answering System) fejlesztése. A neurális hálóra épülő mesterséges intelligencia a hadtéri döntéstámogatásban nagy segítség, hiszen az EQUAS önmaga döntéseit meg is magyarázza: megmutatja a felhasználóknak, hogy mely adatok voltak a legfontosabbak a döntéshozatali folyamatában. A felhasználók kérdéseket tehetnek fel a rendszernek a kiválasztott ajánlásokkal kapcsolatban, és megtudhatják, a rendszer miért utasított el másokat. Az EQUAS nem csak a hadviselésben, de számos más területen is használható, fő célja, hogy segítse az emberi felhasználókat abban, hogy megértsék és hatékonyan kezeljék a „mesterségesen intelligens partnerek” új generációját, és megbízzanak a döntéseikben.

A legfrissebb katonai jellegű MI-hírek egyike, hogy az egyébként is high-tech szemléletéről híres izraeli hadsereg a Hamasz elleni háborújában mesterséges intelligenciát használ. A sors fintora, hogy a 37 000, a terrorszervezethez köthető, gázai bombázandó célpontokat kiválasztó Levander nevű rendszert sok kritika érte a civil áldozatok magas száma miatt. (Ahogy egy tiszt megjegyezte: „hideg” fejjel működik az MI.)

A kérdés továbbra is az minden ilyen megoldással kapcsolatban: hol szerepel az automatikus folyamatokban, az MI döntéseiben az ember?

Vajon elfogynak-e a tanítóadatok a nagy nyelvi rendszerekhez?

Iparág: Biztosítás

Ezúttal egy izgalmas szakmai írást szemlézünk, a cikk végén megadva az eredeti, teljes szöveg elérhetőségét is. A téma a szakemberek körében ismert: eszerint minél nagyobb korpuszon tanítanak egy LLM-et, annál valószínűbbek lesznek a generált válaszai. A problémát viszont nemcsak az egyre emelkedő költségek jelentik, hanem legfőképpen az exponenciálisan növekvő adatigény. A fiatal, de már Google-nak eladott startuppal is büszkélkedő Mark Cummins leírja, hogy miért.

Soknak tűnik, pedig nem az

Cummins alapvetően jól definiált becslésekkel dolgozik, amikor megpróbálja kitalálni a számokat, vagyis, hogy mennyi tanítóadat áll rendelkezésre. Meglepő, de sokkal nagyobb számokra gondolhatunk, ha például az egyes közösségi csatornákon fellelhető (de nem feltétlenül felhasználható) szavakat nézzük. Ebből a szempontból érdekes, hogy a kínai Weibo „csak” 29 trillió szóval rendelkezik, míg a Facebooknál ez az érték 105 trillió. Ez önmagában vaskos számnak tűnhet, de már a nyílt Llama 3-at is 11 trillió szón trenírozták, tehát sehol sincs az olyannyira vágyott exponenciális többlet.

ChatGPT-6, mi lesz veled?

Minden újabb LLM-generáció tízszer annyi adaton tanult, mint a megelőző. Nem véletlen, hogy a világ már lassan két éve hiába várja a ChatGPT-5 bejelentését, de az OpenAI eddig csupán verziófrissítésekkel (és egy remek képességekkel rendelkező ChatGPT 4 omnival) rukkolt elő. Éppen emiatt a szerző úgy véli, hogy a 6-os sorozathoz szintetikus adatokra vagy új ötletekre (!) lesz a cégnek szüksége.

Hol a határ?

A nem angol nyelvű adatok behúzásával Cummins 200 trillióra becsüli a felső limitet. A kutatók, fejlesztők utolsó mentsvárának például a Gmailben is meglévő magánadatok tűnnek, de ezek az információk az emberek profilozásának legvégső eszközei is lehetnek. Kérdés: akarjuk-e ennyire kiadni magunkat csak azért, hogy egy fizetős modell azután verset írhasson nekünk?

A cikk itt eredetiben elolvasható: https://www.educatingsilicon.com/2024/05/09/how-much-llm-training-data-is-there-in-the-limit/

Vau-vau, mondta a gépkutya

Iparág: Biztosítás

A popkultúra persze ezt is hamarabb megérezte. A legendás Black Mirror antológiasorozatban 2017 decemberében mutatták be a Metalhead epizódot: ebben egy robotkutya terrorizálta a disztópikus hangulatú világban élő embereket. A négy lába segítségével mozgó, fej nélküli robotkutya (rém)álma azóta már valósággá vált – és a gépi eb fejlesztésének még mindig csak az elején járunk.

Szerény kezdetek

Ahogy az várható volt, természetesen nem a Metalhead nézői találkozhattak először kutya formájú robottal. Sok-sok távoli „rokona” után a Dél-Kaliforniai Egyetemen dolgozók láthattak először igazán figyelemreméltó szerkezetet ebben a témában: ők voltak tanúi a kutyára igencsak távolról hasonlító, de ígéretes négylábú robot működésének. A Phony Pony nevet kapott mesterséges jószág – nevéhez méltóan – „kaliforniai póni”-t akart inkább megmintázni. Kezdetleges mozgása lassú volt és néhány mozdulatra korlátozódott, míg vezérlését a szomszédos épület második emeletén található miniszámítógéppel vezérelték. A szerkezetet egyébként Andrew Frank építette meg PhD-disszertációja részeként Bob McGhee vezérletével és támogatásával.

A kutatókon kívül már sokkal többen emlékezhetnek a Sony AIBO (Artificial Intelligence RoBOt) robotkutyájára, amely pont az idén ünnepli negyedszázados évfordulóját. Az amerikai palo altoi innovációs központ mintájára létrehozott Sony's Computer Science Laboratory fejlesztette ki a világ első, kereskedelmi forgalomba hozott gépét / játékát. A tényleg szerethető formájú robotkutya öt generációt élt meg és az egyes iterációk során egyre nagyobb tudással rendelkezett. Japán „szokás” szerint akár nevelhettük is a mesterséges jószágot, amely engedelmeskedett japán és angol nyelvű parancsoknak is. Az AIBO egyébként egy olyan robotkutya volt, amely interaktív módon tanult és alkalmazkodott tulajdonosának preferenciáihoz, ami hozzájárult ahhoz, hogy egyedülálló és személyre szabott élményt nyújtson. Az AIBO képes volt felismerni-megjegyezni arcokat és hangokat, illetve olyan mesterséges intelligenciát használt, amely lehetővé tette számára, hogy autonóm módon felfedezze környezetét. Például különböző terepeken képes volt navigálni, elkerülte az akadályokat és ennek megfelelően alkalmazkodni tudott.

Az AIBO mesterséges intelligenciája egy felhőalapon működött, feltöltötte „tapasztalatait” a Sonyhoz, hogy tovább fejleszthessék az MI-motorját. A Sony robotkutyája hivatalosan 2006-ban szenderült jobblétre, miután pénzügyileg nem lett sikeres a projekt az anyacég számára.

Jön, lát, győz Spot

Legtöbben –a korábban bemutatott androidjához hasonlóan – az amerikai Boston Dynamics termékét ismerhetik. A Spot névre hallgató robotkutya eredetileg az MIT-ről induló Marc Raibert professzor cégének egyik ikonikus szerkezete. A 2015-ös Spot a korábbi BigDog modell után kisebb, gyorsabb és mozgékonyabb lett, a hidraulikarendszer meghajtására gázmotor helyett elektromos motort használtak. Egy évvel később a Spot Mini már csupán 25 kilót nyomott, miközben teherbírása 14 kilogrammos lett. 2020 júniusától lehet megvásárolni a Spotot potom 74 500 dollárért.

A Spot többféle ipari környezetben is használható. Bár mozgása nem MI-vezérelt, adatbegyűjtő képessége igen: például mesterséges intelligenciát használ analóg mérőműszerek leolvasására az ipari létesítményekben vagy a hőmérsékleti anomáliák észlelésére is. 2023 októbere óta ráadásul a ChatGPT segítségével beszélni is tud, például egy adott turisztikai helyen idegenvezetőként (!) válaszol az emberek kérdéseire.

Kína sem marad le

Az egyre erősödő informatikai versenyben, az új hidegháború küszöbén a Kínai Népköztársaság sem kíván le- és kimaradni a robotkutya-forradalomból. Shanghai utcáin már 2022 végén feltűntek a robotkutyát sétáltató technofilek, és ez többek közt a Xiaomi cég nem túl kreatív elnevezésű CyberDog termékének köszönhető. A kínai gép fut, fordul, üdvözli az embereket, sőt, még hátraugrásra is képes. Talán még csaholni is a nyugati szuperhatalomra…

A robotkutyák fejlesztésében a legizgalmasabb kérdés továbbra is az: vajon a fogyasztók is tömegesen fognak ilyen gépeket vásárolni, vagy csak céges környezetben képzelhető el a jövőjük?

We are the robots - A mesterséges intelligencia segíti a humanoid inváziót

Iparág: Biztosítás

Jó pár éven keresztül csak a HONDA Asimo nevű robotja, majd a SoftBank népszerű gépembere, Pepper szolgáltatott a nagyközönség számára robotikával kapcsolatos fejleményeket. (Ide sorolhatjuk még Sophia-t, aki inkább a szaúdi állampolgársága miatt került a hírekbe.). Az amerikai Boston Dynamics Atlas nevű robotja szintén, már régóta demonstrálja, hogyan fejlődik a táncolni, ugrálni képes teremtményük, Ennek ellenére sokáig úgy tűnt, hogy az androidok tömeges megjelenése a regények lapjain vagy a filmvásznon marad – míg a mesterséges intelligencia népszerűsége újra reflektorfénybe nem emelte az egyre ígéretesebb fejlesztéseket.

Cikkünkben bemutatjuk, hogy a tömeges elterjedésre leginkább elképzelhető androidmárkák éppen hol állnak és mennyit tudnak.

Elon Musk álma

Nem véletlen, hogy épp ahhoz az üzletember-vizionáriushoz köthető az egyik android, aki már három területen is (digitális fizetőeszköz, magas márkaértékű elektromos autó, űrtechnológia) forradalmat ért el. Igen, Elon Muskról, és a cége által propagált Optimus nevű robotról van szó.

A másnéven Tesla Botnak is nevezett androidról először 2019 nyarán hallhattunk. Az akkori AI Day Eventen bemutatott robot – hasonlóan Tesla másik kezdeményezéséhez, a Neuralinkhez – még nem nyűgözte le a szakértőket. Azóta, például egy 2023 decemberi videóben már látható, hogy a már Gen 2 kategórianevű szerkezet egyre kifinomultabb tudással rendelkezik: például gyorsabban sétál, mint azelőtt, miközben könnyebb lett a tömege, de képessé vált ruhák hajtogatására, illetve tojások megfogására is. Ez utóbbi kettő példa nem véletlen: a robotok egyelőre pont abban gyengébbek, amiben mi, emberek alapból jók vagyunk. Számukra nehéz feladat a tárgyak megfogására, a környezetünk manipulálására, egyszerre több fizikai tett megtételére akár káoszos környezetben is (például tárgyakkal teli padlón). Musk a maga szokásos forrófejű látnokságával azt szeretné, hogy körülbelül 20 000 dollárra szorítsák le az Optimusok árát, és így lehetővé váljon akár többmilliárd ilyen szerkezet eladása. A végső cél a háztartási robotok elterjesztése.

Ehhez a Tesla az autói esetében már használt önvezető rendszert működtető szoftvert használja, amely gyakorlatilag folyamatosan, minden Tesla személyautótól begyűjtött adattal okosabbá válik. Az androidok egyik fő ígérete épp a mobilitás, úgyhogy a Teslánál valószínűleg jó kezekben van a projekt.

Kér egy kávét, kedves gazdám?

A kaliforniai Figure Inc. vállalat január végén került be komolyabban a hírekbe. Ekkor jelentette ugyanis a BMW, hogy dél-karolinai gyárába a cég robotjaiból rendel, hogy az unalmas, ismétlődő munkáktól megszabadítsa emberi dolgozóit.

A Figure 01 néven futó android kicsivel alacsonyabb az Optimusnál, de már olyan emberi képességekkel is rendelkezik, mint a kávéfőzés. Ennél persze sokkal nagyobbak az ambíciók: az idővel zsugorodó üzemi munkaerőpiacra is gondolva a Figure 01 ideális megoldás lehet sokféle területen. Különösen, ha megnézzük, a kávéfőzést hogyan tanulta meg: megnézte, hogy az emberek hogyan csinálják, és ezt utánozva lett neki is feketéje. Ez új módszernek számít, hiszen így sokkal inkább kapcsolódik a való világ környezetéhez, és elsőkézből képes felszívni tudnivalókat, készségeket. Az alig egy esztendős, 70 milliós befektetést bezsebelő, 50 fős cégtől ez a metódus, különösen a BMW-szerződés hatalmas fegyvertény.

Pár perc alatt újat tanul

A norvég 1x vállalatról a szélesebb közönség idén januárban hallhatott először. Az eddig felsorolt androidokhoz képest az EVE nevű termékük magasabb, és kerekeken gurul – tehát gördülékenynek látjuk, ellentétben a megszokott „csoszogós” androidjárással. EVE különlegessége abban rejlik, hogy mozgása fejlettebbnek tűnik a megszokott robotoknál, épp ezért gyárak mellett logisztika területén vagy akár az otthonunkban is használhatjuk. Sőt, EVE esetén érdemes flottában gondolkodnunk: a bemutatóvideó egy igazi science fiction jelenetet mutat be, egy helyiséget, ahol az EVE-k összeszokottan, otthonosan és biztonságosan dolgoznak.

Az alap a neurális hálózatokban keresendő, melynek bemenete a kamera képe, kimenetele pedig a konkrét akció, amit a robot tesz. Vagyis, az éles működés közben a neurális hálózat dolgozza fel a kamera képét és az android az alapján cselekszik. Egy általános alapmodellt fejlesztettek ki a leggyakoribb, hétköznapibb robotnak adható feladatok alapján, és ezt finomítják részfeladatok szerint (pl. raktárkezeléshez). Ezzel a módszerrel a robotok számára az új készségek elsajátítása nem több mint néhány percnyi adatgyűjtés és tanítás egy asztali GPU-n.

Az 1x (a név a robot sebességére utal, vagyis arra, hogy az EVE az emberi sebesség egyszeresével közlekedik, emberszerű) nemrég 100 millió dolláros befektetéssel lett gazdagabb.

Android az űrben

Eggyel még közelebb lépünk az ihletadó science fiction filmekhez, amikor a NASA androidjáról van szó. A General Motors és az USA űrügynöksége 1997-ben kezdett el közösen fejleszteni egy, az űrhajósoknak hasznos gépi segítőn. 2011-ben a Robonaut2 névre keresztelt, még láb nélküli, torzóként egy állványhoz erősített „félrobot” már az első ilyen gépként megjárta a világűrt is.

2014-ben már arról szóltak a hírek, hogy a robonauta két „lábat” – valójában manipulátorkarokhoz hasonló kiegészítéseket – kapott. A folyamatos fejlesztések végső célja az, hogy az emberek az igazán barátságtalan környezetben, nehezebb munkakörülmények közt (például aszteroidákon, mélyűrben vagy épp csak a Nemzetközi Űrállomáson) hasznos segítőtársat kapjanak. Ami kis lépés az androidoknak, az nagy lépés lehet az emberiség számára.

A cikkben nem beszéltünk külön, de figyelemre méltó a kínai óriáscég, a Tencent Robotics X divíziója, amely például idősápoló robotokat tervezésével is foglalkozik.

A robotika szélsebesen fejlődő terület. Egy ideig csendben, a nyilvánosság kizárásával folytak a fejlesztések, de az MI látványos berobbanása az iparági kilátásokat is optimistábbá tette.

Egykor futurizmusnak számított a német Kraftwerk zenekar We Are the Robots című dala, ma pedig lassan valósággá válik az együttélés. A kérdés az, hogy vajon mely robotok fognak úgy elterjedni a jövőben, mint ahogy azt az Én, a robot című filmben láthattuk?

Újdonságok az SPSS háza táján

Újdonságok az SPSS háza táján

Wannabe írók és az MI

Irodalom végveszélyben?

Szerzőtársat kaptunk

Felkészül: az újabb generáció

Tényleg öntudatra ébredt MI-ről van szó?

Miért lelkesek a kreatív szakemberek a chatbotot használva?

Miért várnak visszafojtott lélegzettel a programozók?

Jó-jó, de a ChatGPT akkor most tényleg elveszi a munkát?

A Microsoft keresője lenyomhatja a Google-t?

A transzformertől a Gemini 2.0 Flash-ig

A Google AI stratégiája 2017 óta

Kulcsfontosságú modellek és mérföldkövek

Kudarcok és kihívások

Gemini 2.0 Flash: egy hatalmas dobás

Izrael, az MI nagyhatalma

A virágzó izraeli MI-szektor

A legnagyobb izraeli MI-cégek

Az izraeli AI legfontosabb felhasználási területei

Az izraeli védelmi szektor szerepe az AI-ban

Izraeli kilátások és kihívások az AI-ban

A kilátások

Az izraeli második fázis fókuszterületei

Az MI globális központjává válás útján

Az Emírségek MI-stratégiája

Kormányzati támogatás: az innováció motorja

Globális játékos

Etikus MI-keretrendszer

AIATC: Az MI-fejlesztés irányítója

Saját nagy nyelvi modell

Mesterséges intelligencia a mindennapokban

Fontos cégek

Nem képtelenség a fejlődés

Több mint kísérletezés

Egy új korszak kezdete

De mit adott nekünk a Midjourney?

A jövő...?

Útikalauz MI-stopposoknak

Így készült a jelentés

Nem hype, nincs lassítás

Szeretlek is meg nem is

USA vs. Kína

Három meglepő adat az AI Index 2025-ből

Szép új világ…?

Ami nem látszik messziről: a nagy nyelvi modellek korlátai

Élet a statikus adatkorszak után

A tapasztalati korszak négy alapvető jellemzővel bír:

„Winds of Change”

Mire számíthatunk?

Hogyan készüljünk fel?

Dr. AI

Tanárok után a vállalkozások, avagy az EdTech veszedelme

A tanulás régi-új módja

Sportot csináltak a győzelemből

Ütő, labda, adattenger

Látlak, égő versenyautó

Most „ilyen, ilyen a boksz”

A jövő sportja

Alibaba és az MI: kezdetek

A kínai ChatGPT

Alibaba az olimpián

sajtó csomag

SAJTÓKAPCSOLAT

Bitcoin, i2 és ClemNext: 3 téma, 3 előadásban

Csatlós Béla, IT Support, Clementine

Hegedüs Pál, vezető elemző, Clementine

Gergely Norbert, szakértő, Clementine

További hírek

Legfrissebb hírek

Mit tud a DeepSeek V3 és R1?

Milyen szakmai alapokon működik a DeepSeek?

Mit jelent a „reasoning” a DeepSeek esetében?

Rendben, de mennyibe kerül mindez?

Mi a DeepSeek és a mögötte lévő kínai cég és az alapító története?

Miért kell félnie az Nvidiának a DeepSeek-től?

Mi a további fejlesztési irány?

Hogyan hat a DeepSeek az amerikai-kínai technológiai hidegháborúra?

Történelmi pillanat

Kritikusabb hangok