dataSTREAM 2017

A 2017-es dataSTREAM konferencia a kritikus gondolkodás és az emberi döntések szerepéről szólt egy olyan korszakban, amelyben úgy érezhetjük, a gépek helyettünk tanulnak.

Körmendi György, a Clementine ügyvezetője nyitóelőadásában az adattudomány előtt álló döntéseket hangsúlyozta – a kognitív éra küszöbén fókuszba kerül a szakma, ezzel párhuzamosan pedig a szakmai identitás átkeretezésére is sor kerül. A szakemberek választhatnak az on-premise platformok és a felső alapú megoldások közül (a hibrid ajánlatok középtávon jó alternatívát jelenthetnek), illetve vannak, akik magas szintű eszközöket alkalmaznak az adatokban rejlő mintázatok feltárásához, míg mások a kódoláshoz ragaszkodnak. Az IBM Data Science Experience platformja új mérföldkövet jelenthet az elemzésben – felhő alapú és open-source megoldások, együttműködést támogató funkciók, szakmai tudásáramlás, és hamarosan az SPSS Canvas is beépül a rendszerbe – így hatékony, egységes munkafelületet biztosít az adatelemző munkatársaknak.

Kókai Dávid, a We Love What You Build alapítója a Lego alkatrészek másodlagos piacának vadnyugati hangulatáról mesélt. Tudtátok, hogy a Lego 11 szürke árnyalatot gyárt? Ráadásul egy 1x2-es (kékes)szürke elem 9-szer annyit ér, mint egy 1x2-es kommersz sárga elem? Míg a Lego kizárólag készleteket árul, addig a fregmentált másodlagos piacon akár évekkel ezelőtt kiadott készletekből is lehet alkatrészt vásárolni. A másodlagos piacterek transzparensek, ebben hasonlítanak a pénzpiachoz – Kókai Dávid a cikkelemekből adatbázist épített, és az adattudomány segítségével igazgatja vállalkozását: data támogatja az optimális készletgazdálkodást, az árazást, a vevőprofilozást, a direkt marketinget, a beszerzést, a minőségbiztosítást és a logisztikát. Azonban a szabályozott pénzpiacokkal ellentétben a Lego alkatrészek piacán vadnyugati szabályok érvényesülnek: megengedett a versenytársak kulcstermékeinek felvásárlása, a saját forgási sebesség növelése.

Lányi Dávid, az IBM Research zürichi laboratóriumának mérnöke úgy gondolja, a digitalizált vállalatok között a kognitív üzletág tesz majd valódi különbséget. Azoknak, akik előre rettegnek az automatizálástól, és attól, hogy a gépek miatt elvesztik állásukat, az IBM bíztató víziót sugároz: az előadáson az augmented intelligence (kiterjesztett intelligencia) képét vázolta fel a szakember, melynek segítségével az átlagos munkavállalót a technológia segítségével felvértezik, hogy a legjobbak hatékonyságával bírhasson. Erre példa egyik projektjük, melyben mellrákos szövetmintákat elemeztek deep learning módszerrel – a programot egy nyár alatt fejlesztették, és közel olyan pontossággal azonosította a mitózisokat, mint egy olyan szakorvos, aki 8-10 évet töltött ezeknek tanulmányozásával. Emiatt az orvosoknak nem szükséges karrierváltáson gondolkozniuk; a módszer mindössze egy objektív másodvéleményt ad, támogatja a szakemberek munkáját.

Kovács-Ördög Zita és Pancza Judit bemutatták a Clementine új munkatársát, BOTondot. BOTond egyelőre próbaidőn van a cégnél, és szorgalmasan tanítják neki a szervezeti információkat, hogy minél gördülékenyebben válaszolhasson az érdeklődők kérdéseire. BOTond előnye, hogy szabálykövető kolléga, ellenben demotivált – tudását magától nem bővíti, ráadásul feledékeny. Az új munkatárs cégünk profiljához illeszkedik: szabályalapú chatrobot, Emíliához (virtuális banki asszisztens) hasonlóan, akit 2016-ban mutattak be, és egyszerű banki kérdésekre válaszol szóban. 2020-tól várhatóak az „intelligens” robotok, akik prediktív modellel válaszolnak, maguktól is tanulnak – kérdésekből és válaszokból egyaránt -, NLP-t használnak, és emlékeznek a korábbi beszélgetésekre.

Mit értünk adatvezérelt szervezet alatt? Tompa Miklós, a Clementine üzletfejlesztési igazgatója a vállalat felmérésének eredményeiről beszélt, amelyben azt vizsgálták, hol helyezkednek el az adatelemző csapatok a szervezetekben, hogyan és milyen módszerekkel dolgoznak. Problémát jelenthet, hogy az adatelemző csapatok nincsenek megfelelően integrálva a szervezeti felépítésbe, az adatrészlegeknek nincsenek mérhető teljesítménymutatóik, mindösszesen a határidők tartása. Gondot okozhat az is, hogy a vevők nem elemzési szakemberek, az elemzők kevéssé érzékenyek az üzleti igényekre, ezért nem képesek releváns kérdéseket megfogalmazni. Érdekes eredmény, hogy mindösszesen egy megkérdezett cégnél volt valódi Big Data megoldás nemzetközi csapat szinten. A szakember tanácsa, hogy minden folyamatban legyen jelen az adat, és generáljon üzleti hasznot; az eredményességhez az elemző csapatnak mérőszámokra, integrált analitikai eszközökre van szüksége és a speciális feladatokhoz open-source megoldásokra. Erre később hasznos felület lehet az IBM Data Science Experience, amelyről Körmendi György előadásában hallhattunk korábban.

Kovács Gyula, a Fókusz takarékszövetkezet projektigazgatója az adattudósokat a görög tudósokhoz hasonlította: Eratoszthenész kevés információból közel teljes pontossággal becsülte meg a Föld kerületét. Az elemzők feladata is hasonló: viszonylag kevés adatból próbálnak pontos előrejelzéseket adni. A szakma egyik kihívását az ügyfelek elvárásmenedzsmentjében látja, nem érdemes illúziókba kergetni a vevőket, ne várjanak csodát. Véleménye szerint Magyarországon adatéhség uralkodik, és rettenetes éhség esetén a vajas kenyér is megfelel, tehát a gyorsan elkészíthető, egyszerű eredmények; a szakember azt javasolja, feleslegesen ne bonyolítsuk az elemzéseket. Jó tanács azonban, hogy olyan elemzéseket is végezzünk el, amelyekre az ügyfél esetleg nem gondolt, így nem csak az ő megérzéseit támasztjuk alá, hanem új információt is nyújthatunk, ez pedig hozzáadott értéket jelent.

Ádám Gábor, az IFUA Horváth & Partners Advanced Analytics vezetője – ez a terület a menedzsment tanácsadás és az adatbányászat találkozása. A felsővezetők gyakran nem értik a riportokat, ezért nem integrálják a feltárt információkat a folyamatokba, ezért Ádám Gáborék könnyen érthető, dashboard alapú kimutatásokat nyújtanak az ügyfeleknek, ami hasznosítható tudássá alakul. A prediktív előrejelzési megoldásokon – amelyek alapját idősoros elemzések adják - a Clementine munkatársaival dolgoznak együtt. Az egyik vezető gyógyszergyártó cégnek 24 hónapra készítettek kereskedelemi előrejelzéseket (ehhez szükségük volt minimum 24 hónap tanulási adatra). A szakember felhívta a figyelmet arra, hogy a prediktív elemzéseket érdemes havonta pontosítani új adatok bevitelével, továbbá az emberi előrejelzések gyengeségeire is rávilágított, hangsúlyozta a kognitív torzítások hatását a predikciók pontosságára (múltbéli események, horgonypontok, például a válságnak sokkal nagyobb jelentőséget tulajdonítanak, mint a gépi elemzések).

Máté Anna, a Clementine elemzője a biztosítási csalások hatásaira hívta fel a hallgatóság figyelmét. Szakértők becslése szerint az összes bejelentés 5-10%-a lehet csalás, pedig a csalások felderítésével a biztosítócégek elkerülhetnék a jogosulatlan kifizetéseket, amelyek több milliárd forint kifizetést is jelenthetnek évente. Az elemző a gépjármű-biztosítási csalásokkal foglalkozott részletesebben: ezeknek egy részét egyedül követik el (például utólag köt biztosítást a káresetre, vagy nagyobb összegű káresetet jelent be, mint amire valójában jogosult), azonban a nagy horderejű csalás-sorozatokat csoportosan hajtják végre (megrendezett balesetek és lopások, öltöztetések). A csoportok jó eséllyel felderíthetők kapcsolatiháló-elemzéssel. A Clementine szakembere az előre meghatározott elemzési módszerrel, IBM i2 Analysts’ Notebookkal dolgozott, így feltárhatóvá váltak a kulcsszereplők és az összeköttetések. A biztosítási csalások hatékony feltérképezéséhez sokban hozzájárulna egy összevont biztosítási adatbázis, hiszen az érdekeltek általában nem ugyanannál a cégnél követik el az ismételt csalásokat.

Mándli Anna, a Robert Bosch Kft. autóelektronikai technológiákat fejlesztő csapat tagja a gyártási folyamatokat adatbányászati módszerek segítségével optimalizálja. Egy-egy alkatrész, termék gyártásában több gyártósori gép működik közre, az adatok segítségével azonosították a hiba forrását, majd vizualizálták a legfontosabb tényezőket, hogy később is könnyen ellenőrizhetővé váljanak. Eredményeiket a fejlesztő csapattal és a mérnökökkel egyeztették. A gyártás során keletkezett adatok forrása azonban nem stabil – a mérések gyakorisága ingadozó, a különböző időintervallumokban keletkezett adatok nem összehasonlíthatóak, ráadásul a gépek kalibrálása, a gépek közötti különbségek is kihívásokat állítanak a szakemberek elé.

A konferenciát Könyves Tóth Előd előadása zárta, aki rengeteg érdekességet és különböző jövőképeket vetített a vászonra. Szembe állította az AI effect jelenséget az általa megfogalmazott AI komplexussal. Az AI effect a mesterséges intelligencia tagadása, melynek során bármilyen áttörést ér el a terület, a kritikusok azt mondják, ez nem valódi mesterséges intelligencia; így a mesterséges intelligencia mindig az marad, amit még nem értünk el. A szakember által megfogalmazott AI komplexus a mágikus gondolkodással analóg: az ilyen típusú ember minden tárgynak különleges hatalmat, lelket tulajdonít, mindenben az AI-t látja. Könyves Tóth Előd felhívta a figyelmet arra, amit sokan tudnak, de rendre elfelejtenek: az eszköz csak akkor intelligens, ha intelligensen használják. Ne essünk abba a csapdába, hogy kizárólag a gépektől várjuk a tudást.