Skip to main content

Rendezvény

sajtó csomag

Töltse le a Clementine bemutatkozó anyagát.

SAJTÓKAPCSOLAT

E-mail: Ez az e-mail-cím a szpemrobotok elleni védelem alatt áll. Megtekintéséhez engedélyeznie kell a JavaScript használatát.
Tel: +36 1 457 0561
Fax: +36 1 457 0562
Cím: 1115 Budapest,
Bartók Béla út 105-113.

dataSTREAM 2025 – már elérhetők a prezentációk és előadások

Rendezvény

2025. május 20.

A nagy nyelvi modellek (LLM-ek) rohamos fejlődése alapjaiban rengeti meg az adattudomány világát. Egyre több vállalat próbálja kihasználni ezt a technológiát belső adataik feldolgozására és üzleti folyamataik támogatására. De vajon kinek a feladata egy LLM integrálása? Egy machine learning mérnöké, egy backend fejlesztőé, vagy az adattudósoké?

Mit jelent mindez az adatos szakma jövőjére nézve? Az LLM-ekkel való munka új kihívásokat is hoz: prompt engineering, a modellek finomhangolása és alkalmazásának optimalizálása, a hallucinációk és félreértelmezések minimalizálása, nem is beszélve az egyre gyorsabban változó eszközkészlethez való alkalmazkodásról.

A konferenciánk egyik célja az volt, hogy megvizsgáljuk, milyen szerepet tölt be egy adattudós ebben az új környezetben. Emellett érdekes esettanulmányokat hozunk a legkülönbözőbb területekről, mint az ügyfélszolgálat vagy az agrártudomány.

A konferencia előadásait és prezentációit most azokkal is megosztjuk, akik lemaradtak a rendezvényről, vagy visszanéznék a legérdekesebb részeket. Az előadások rövid leírása, valamint az elérhető prezentációk és videófelvételek az alábbi cikkben találhatók.

Körmendi György

Ügyvezető igazgató, Clementine

A 90-es évek vége óta foglalkozik adatbányászattal, adatelemzéssel, adattudománnyal. Társaival 2005-ben alapította meg a Clementine-t, amely az adattudományi, statisztikai és gépi tanulási technológiák egyik vezető magyar szállítója, az SPSS, az i2 és más elemző szoftverek magyarországi specialistája. A Clementine a szoftverdisztribúció és a klasszikus kognitív rendszerek mellett a magyarországi üzleti hang- és szöveganalitika úttörő innovátora, magyar nyelvű komplex gépi rendszereik egyedülállóak. Körmendi György a Láncreakció podcast egyik állandó résztvevője.

Bevezető, Néhány ellentmondás az AI háza táján manapság

Gáspár Csaba

CEO & data scientist - Dmlab / BME oktató

Szenvedélyes adatelemző, data scientist, a Dmlab nevű adatbányászati műhely vezetője. A pénzügyi szektortól egészen a gyártási területig számtalan helyen vezetett be új adatelemzési megoldásokat és technológiákat, részt vett a RapidMiner által felvásárolt Big Data technológiákat építő startup elindításában, de többször volt nemzetközi adatbányászati versenyek nyertes csapatának tagja is. Csaba műegyetemi oktatóként sok száz embernek tanította már meg, miképpen lehet az adatok mélyén rejlő összefüggéseket megérteni.


A data scientist a generatív AI hálójában 

A generatív AI az elmúlt két és fél évben jelentős változott az egész IT világában, ez különösen igaz a data scientistek munkájára. Érdemes ezt a változást közelebbről áttekinteni, mert a mesterséges intelligencia körüli médiazajban kifejezetten nehéz elválasztani a vágyakat, a félelmeket a valós változásoktól. Előadásában körüljárja milyen módon változtak az elvégzendő feladatok az elmúlt időszakban, hogyan betonozza be az új technológia a Python pozícióit a szakmában, milyen módon feszül egymásnak a munkavállalói és a vállalati érdek, mennyiben várunk mást a junior adatelemzőktől, milyen módon erősödik a senior data scientistek pozíciója.

Pohly Ferenc

Műsorvezető, a Minerva Kutatóintézet ügyvezető igazgatója

A Leopoly virtuális valóság fejlesztésekkel foglalkozó cég product ownere, az AI alapú Minerva Kutatóintézet vezetője, illetve a csúnyarosszmajom és Láncreakció podcastok műsorvezetője. Korábban az online üzlet minden kulcsterületén dolgozott már: stratégia, tartalomgyártás, digitális marketingkommunikáció, fejlesztés, startupok és mesterséges intelligencia egyaránt szerepel a portfóliójában, közben többször újságíró is volt, például a Magyar Narancsban. Vele indult az ős-Origo, a VS.hu és a megújult RTL.hu, vagy éppen az iWiW és a Freemail.


Kizökkenthetetlen AI kérdezőbiztossal az objektív közvéleménykutatásért

A Minerva Kutatóintézet robot asszisztense tetszőleges sebességgel tudja lebonyolítani a telefonos közvéleménykutatásokat, nem sugall válaszokat, viszont képes kezelni a nyílt kérdéseket is. Mindezt a drága emberi közreműködés nélkül. Egy robot közvéleménykutató intézet elindításának kihívásai és az első eredmények.

Recski Gábor

Számítógépes nyelvész, a Bécsi Műszaki Egyetem (TU Wien) nyelvtechnológiai kutatócsoportjának vezetője és a KR Labs GmbH társalapítója

Kollégáival évek óta fejleszt nyílt forráskódú, nagy megbízhatóságú AI rendszereket, melyek képesek ötvözni a modern gépi tanulási módszerek és a klasszikus szabályalapú rendszerek előnyeit. A KR Labs csapata az egyetemi kutatásokra építve most olyan új technológiákat fejleszt, melyek lehetővé teszik a korábbiaknál megbízhatóbb, transzparensebb, ellenőrizhetőbb és etikusabb mesterséges intelligencia alkalmazásokat.


Hogyan bízhatunk meg az LLM-ekben?

A nagy nyelvi modellek (LLM-ek) széleskörű elterjedése óta az egyik legismertebb ipari alkalmazásuk a kereséssel támogatott kérdés-megválaszolás. Az angolul retrieval-augmented generation-nek, RAG-nek nevezett eljárás lényege, hogy a felhasználó kérdése alapján először klasszikus keresést futtatunk valamilyen szöveges adatbázison, majd az LLM-et úgy instruáljuk, hogy a legrelevánsabb néhány dokumentum alapján válaszoljon a kérdésre, ezzel növelve a modell megbízhatóságát. Azonban a RAG rendszerek sem mentesek az ún. hallucinációtól, amikor az LLM válaszában téves, irreleváns, illetve a kiválasztott dokumentumok által alá nem támasztott információkat közöl. Ez a jelenség ellehetetleníti a RAG bevetését olyan kritikus területeken mint pl. a jogi, orvosi, vagy pénzügyi témájú kérdés-megválaszolás. Erre a kihívásra kínál megoldást a KR Labs által kifejlesztett, nyílt forráskódú VerbatimRAG rendszer, amely a RAG eljárás utolsó, legkockázatosabb lépését bontja le megbízhatóbb részfeladatokra, és biztosítja, hogy a rendszer által adott válaszok szóról szóra (verbatim) a szöveges adatbázisból származzanak.

Pancza Judit

elemző, Clementine

2007 óta dolgozik a Clementine-nál. Munkája során főként az innovatív szemléletű adat-, hang- és szövegbányászati módszertanok kidolgozásával, újító és egyedi megoldásmódok alkalmazásával, illeve azok sikeres vállalati implementációjával foglalkozik.


OSINT és az AI

Az OSINT egy-egy entitáshoz kapcsolódó tartalmak felkutatása, összefüggések feltárása és elemzése internetes, nyílt források felhasználásával. A tevékenység magában foglalja a különböző kereső alkalmazásokban való lekérdezést, a találatok vizsgálatát, a releváns adatok szűrését, ezek feldolgozását. Az előadás bemutatja, hogyan használhatók ezek az egyszerű és a professzionális OSINT eszközök az LLM-ek által generált tartalmak azonosítására, így hogyan segíthet az OSINT a fake tartalmak elleni küzdelemben, a csaló felhasználók azonosításában.

Csatlós Béla

szakértő, Clementine

Mottó: „Az ember harmadik legjobb barátja a hálózat.” A Clementine csapatában ezen barátság elmélyítésére nap mint nap lehetőség adódik: adatbázisok, adatsémák, interfacek, elmélet, módszertan, gyakorlat, támogatás és a legújabb i2 Group képességek integrálása elemző rendszerekbe.

Kézműves API adatok, az elemzők konyhájából

A publikusan elérhető információk aranykorában, gyakran csak vállat vonunk egy izgalmas, elemzésbe bevonható új adatforrás hírére, mivel az interface kialakítása egyet jelent egy új informatikai projekt létrehozásával. A kérlelhetetlenek belevágnak a projektbe, még elszántabbak megtanulnak programozni, interfészt létrehozni. Mutatkozik egy új lehetőség, egy adatvizualizációval és adatfelderítéssel támogatott eszköz, ami az elemzők számára barátságos low code megoldással teszi használhatóvá az API-kon keresztül elérhető adatokat. Az API többé nem fal, hanem nyitott ajtó: bemutatkozik az i2Group Connector Designer.

LÁNCREAKCIÓ ÉLŐ FELVÉTEL

Pohly Ferenc, Körmendi György és Gáspár Csaba