Hírek

Ilyen volt a dataSTREAM 2022

Rendezvény
2022.06.09. 01:52

ADATELEMZÉS A SZUPERSZÁMÍTÓGÉPEK KORÁBAN? Három évnyi kihagyás után idén májusban ismét megrendezésre került az iparág trendjeit, újításait bemutató szakmai konferenciánk, amelynek helyszínét idén a CEU Nádor utcai épülete szolgáltatta. A konferencia témája a szuperszámítógépek köré épült. A résztvevők színvonalas előadások során kaphattak választ többek közt olyan kérdésekre, minthogy mikre alkalmazhatóak a kivételesen nagy számítási kapacitással rendelkező rendszerek, vajon meddig lehet még teljesítményüket fokozni, vagy hogy éppen hogyan változtatják meg az adattudósok életét a szuperszámítógépek.

A rendezvényt Körmendi György, a Clementine ügyvezetőjének előadása nyitotta. Bevezetőjében átfogó képet adott az adattudományokat érintő jelenlegi trendekről. Szó esett arról, hogy milyen változásokat hoztak az iparágra az elmúlt évek eseményei, mint a pandémia, az orosz-ukrán háború. Beszámolt az utóbbi években elért áttörésekről a transzformer modellek kapcsán, illetve, hogy ezek milyen előnyökkel járhatnak, ám ezek mellett milyen problémákat vethetnek fel a későbbiek során. Végezetül pedig arra adott választ, hogy valóban az elemzők, adattudósok, illetve kódolók aranykorát éljük-e.

A szakmai előadások sorában Dr. Szépszó Gabriella, az Országos Meteorológiai Szolgálat Modellezési osztálya osztályvezetője következett. Prezentációjában áttekintést adott arról, hogy a szuperszámítógépek milyen fontos szerepet játszanak a meteorológusok mindennapi munkájában. Elsőként az időjárás-előrejelzés lépéseit, számításigényeit, a rövidtávú modellezés informatikai hátterét ismertette, majd az éghajlati modellezést mutatta be hasonló szempontok mentén. Előadásában részletezte az előrejelzésekhez felhasznált méréseket, hogy honnan származnak az adatok. Kitért az előrejelzésekben rejlő bizonytalanságokra, valamint illusztrálta az operatív modellfuttatások eredményeinek, pontosságának fejlődését az elmúlt évek során.  Bemutatóját azzal a konklúzióval zárta, hogy munkájuk során a bizonytalanságok figyelembevétele elengedhetetlen, ami pedig a számításigény növekedésével jár, emiatt is fontos a szuperszámítógépek bevonása munkájuk esetén.

Ezt követően Schin Lotár, az OTP Bank senior technical domain lead-je, a bank AI infrastruktúrájának jelenét, múltját és jövőjét vázolta fel a jelenlévők előtt. Elmesélte, hogyan élték meg a Cloudera Private Cloud irányába való elmozdulást a közelmúltban, amit követően a SambaNova systems jelenlegi bevezetése esetén is hasonló utat járnak be.  Korábban a napi egyszeri modellfuttatásról áttértek a percenként, másodpercenként futtatható mikró szolgáltatásokra, megkeresték azok helyét az egész rendszerben. Jelenleg hasonló a helyzet, ám most már a szuperszámítógép helyét keresik.

Ha valaki nem gondolkodott el még azon, hogy miben hasonlít egymáshoz a gyöngyhalászok és az adatelemzők munkája, Kovács Gyula, data science coach-tól többek között erre a kérdésre is választ kaphatott. Az előadó szemléltette, hogy sok esetben miért nem érti meg egymást az adatelemző és az üzleti döntéshozó. Modellje szerint két világ azonosítható egy cégen belül: a valódi és a virtuális. A valódi világot a döntéshozók, menedzserek képviselik, akik pénzben, profitban, termékben gondolkoznak. Az adatelemzők pedig, akik az adatokat látják, a gép előtt ülnek, a virtuális világban élnek. A való világban mozgó menedzser kér tanácsot az adatelemzőtől. Előadásának egyik fontos üzenete, hogy a két világ együtt csak úgy tudja megtalálni a problémákra a legjobb választ, ha a döntéshozó és az adatelemző kommunikálnak egymással. Bizonyos üzleti helyzetek esetén a probléma megoldása csak félig olvasható ki az adatokból, ezért elengedhetetlen, hogy az adatelemző kérdezzen. Előadása lezárásaképp három izgalmas esetet mutatott be, melyekben egy döntéshozó és a “KGy” monogramú elemző kisebb-nagyobb sikerrel működött együtt.

A szakmai előadások sorát Hajós Bernadett, őrnagy, a NAV Bűnügyi Főigazgatóságának Bűnügyi Elemző- és Értékelő Osztályának főnyomozója folytatta. A konferencia részvevői részletes képet kaphattak arról, hogy milyen adatbányászati és adatvizualizációs eszközökkel derítik fel és elemzik a pénzügyi, gazdasági bűncselekmények nyomozása során az elkövetők cégadatait, céghálózatát. Egy videó segítségével betekintést nyerhettek ennek gyakorlati felhasználásába is. Az előadás végén arról is szó esett, hogy a bűnügyi elemzés még jelenleg nem az a terület, amit gépekkel fel lehetne váltani, szükséges hozzá az a hozzáadott érték, ami a szakértők tudása.

Az ebédszünet előtti blokkot Kárpáti Endre, az Erste Bank vezető üzleti elemzője zárta. Előadásában arra a kérdésre adott választ, hogy a hagyományos data science megoldások hogyan maradhatnak versenyben a nyílt forráskódú megoldások mellett. Prezentációjában beszélt arról is, hogy a bankon belüli szigorú szabályozások miatt nem, vagy csak nagyon korlátozottan használhatnak nyílt forráskódú programozási nyelveket. Bemutatta, hogy az Erste Bankban milyen felhasználási célokat szolgál ki az IBM Modeler mint data mining tool. Bemutatóját a bankot érintő iparági kihívások és lehetőségek ismertetésével zárta.

Az ebédet követően Molnár Anna, a Clementine junior elemzője a Python programnyelv GPU-val való használatának útvesztőit mutatta be saját tapasztalatai alapján. A prezentáció rámutatott arra, hogy bár manapság nagyon felkapott téma a GPU programozás, hiszen segítségével a kódok futási ideje jelentősen csökkenthető, korántsem olyan egyszerű feladat a GPU-ra áttérés. Egy rövid elméleti bevezető után arról beszélt, hogy milyen GPU-ra optimalizált Python csomagok léteznek. Az előadó két példán keresztül mutatta be, hogy milyen kihívásokkal találkozhatnak a szakemberek, amíg eljutnak odáig, hogy kódjuk GPU-n fusson.

Ezt követően Huszti Dániel, az IBM data&AI technical sales szakembere megismertette velünk, hogy mik jelenleg a trendek az IBM data science világban. Előadásában beszélt az IBM Cloud Pak for Data-ról, amely a felhasználók számára nyújt egy olyan on-premise szolgáltatáscsomagot, amely a legújabb data science technológiákat tartalmazza. A prezentáció során esettanulmányokon bemutatva láthattuk az IBM átfogó Data Fabric koncepcióját.

A konferencia záróeseményeként a rendezvény otthont adott a Láncreakció Podcast legújabb adásának felvételére. A podcast 58. adásának szereplői Pohly Ferenc, Körmendi György, Kovács Gyula és Könyves Tóth Előd voltak. A konferencia résztvevői előtt zajló, kerekasztal beszélgetés formájában történő podcastfelvételt a nézők élőben követhették, illetve többször is megszólítva, interaktív módon valódi részesei lehettek az élménynek.  A szakértők a lyukkártyákról, illetve Pataki Ferenc fejszámoló művészről tett rövid kitérő után a konferencián megtartott prezentációk által felvetett kérdéseket járták körül, emelték ki a hallgatóság számára az előadások legfontosabb üzeneteit.

A podcast konferenciához kapcsolódó, nem mindennapi 58. adása már elérhető. Érdemes meghallgatni!

Tovább olvasom »

Tovább olvasom »

Tovább olvasom »

Tovább olvasom »