Fiatal adatelemzők segítik a BKK-t a Bubi fejlesztésében

A Budapesti Közlekedési Központ az MTA SZTAKI-val együttműködve hirdette meg a MOL Bubi adatelemzési versenyt a kerékpáros közösségi közlekedési rendszer üzemelése során összegyűlt adatok elemzésének céljából 2015 szeptemberében. A verseny három feladatból állt, és ebből az egyiket a Clementine Consulting által elemző szoftverrel támogatott Bubilyze! csapat nyerte meg.

A kiírás egyetemi hallgatóknak, adatbányászati szakembereknek és lelkes adatkedvelőknek szólt. A résztvevők 5 hónapnyi adathalmazt kaptak meg a kiinduló- és célállomásokról, a használat kezdetének és végének idejéről, valamint további adatokat a dokkoló állomásokra és az időjárásra vonatkozóan. Ezek szakszerű feldolgozása során olyan érdemi következtetésekre juthattak, amik a jövőben a BKK hasznára válhatnak a MOL Bubi szolgáltatás fejlesztésekor.

A három feladat közül kettő prediktív analitikai megoldásokat kívánt: az elsőben a MOL Bubival használt legnagyobb forgalmú útvonalakat kellett megjósolni, a másodikban pedig az egyes gyűjtőállomásokon az adott napon belüli legnagyobb kerékpárfogyást. A harmadik feladat során a csapatok szabadon dolgozhattak az adatokkal, és a leginnovatívabb kutatási eredmények felmutatása volt a cél.

A Bubilyze! csapat (Badics Milán – Corvinus Egyetem Befektetések és Vállalati Pénzügy Tanszék, Balogi Csilla – Clementine Consulting, Bíró Márton – i-insight, Fülöp Árpád – Balabit, Windhager-Pokol Eszter – Balabit) az első feladatban teljesített a legeredményesebben, és ezzel 100 000 Ft-os pénzjutalmat illetve egy egyéves MOL Bubi bérletet nyertek. A feladat során kapott eredményeiket 2016. január 13-án a verseny záró rendezvényén prezentálták a BKK képviselői és a többi résztvevő előtt.

A csapat a Clementine Consulting jóvoltából az IBM SPSS Modeler szoftvercsaládot is használta az előrejelző modellek elkészítéséhez, amelyről így nyilatkoztak: „Azért az SPSS termékekre esett a választás, mert ezt találtuk a leghatékonyabb eszköznek. Rendkívül gyorsan lehet az adattisztítási, adattranszformálási lépéseket előállítani, és kellő rugalmassággal rendelkezik ahhoz, hogy a modelleket szabadon paraméterezhessük. Rengeteg automatizált döntést-segítő funkciója révén (pl. automatikus statisztikák, összehasonlítások a különböző modellekről) nagyon gyorsan ki tudtuk választani a legjobb eredményt adó módszereket. Így maradt időnk sörözni is.”

A Clementine Consulting ügyvezetője, Körmendi György elmondta, hogy büszke a nyertes csapatra, és úgy gondolja, külön köszönet illeti az MTA SZTAKI Adatbányászati és Webes Keresés Kutatócsoportot, amiért lehetővé tette egy ilyen verseny létrejöttét. Továbbá megjegyezte azt is, hogy a Clementine Consulting számára is pozitív megerősítés az, hogy a Modeler nem csak üzleti területeken, de laboratóriumi körülmények között is ilyen jól teljesít.

Együttműködés a Pannon Egyetemmel

2015. november 26-án a Clementine Consulting és a Pannon Egyetem mindkét fél számára előnyös együttműködési megállapodást kötött.

Cégünk képviseletében Körmendi György ügyvezető, az egyetem részéről pedig Dr. Gelencsér András rektor valamint Dr. Kovács Gyula kancellár közösen megállapodtak egy határozatlan idejű együttműködési kapcsolat kialakításában, ami az alábbi területekre terjed ki:

  • Az egészségügyi ellátó rendszerrel kapcsolatos adatok elemzése, új adatelemzési módszertanok kidolgozása
  • Új adattárolási, adatfeldolgozási illetve -megjelenítési módszerek kidolgozása az egészségügyi informatika és egyéb területeken, a nyilvánosságra hozható eredmények publikálása
  • Fenti témákban közös kutatás-fejlesztési pályázatok kidolgozása és benyújtása

Az együttműködés nyomán a Pannon Egyetem Műszaki Informatikai Karának Egészségügyi Informatikai Kutató-fejlesztő Központjával folytatunk majd közös munkát.

Data or it didn’t happen!

Vagyis ha nincs róla adatod, meg sem történt. A kifejezést nem olyan régen egy konferencián hallottam először, ahol az előadó arról a hatalmas adatmennyiségről beszélt, amit te vagy én naponta termelünk magunkról, magunktól.

A számunkra meghatározó élményeink nagy részéből ugyanis biztosan adat lesz valamilyen digitális szolgáltatás vagy applikáció használatán keresztül: muszáj megmutatnunk a világnak ha láttunk valami szépet, ettünk valami finomat, olvastunk valami érdekeset, vagy voltunk egy új helyen. Reggel az első dolgunk, hogy elolvassuk az emailjeinket, aztán lájkoljuk az alvás közben elmulasztott posztokat a Facebookon, majd a meleg paplan alól még gyorsan feltöltünk egy képet az Instagramra a hétvégi buliról indulás előtt (#instamood #latergram #TGIF #yoloka). Munkába menet meghallgatjuk a Spotify algoritmusa által összeállított személyre szabott lejátszási listát, napközben pedig a háttérben fut a Facebook és már anya is csak a Whatsappon érdeklődik, hogy ugye nem történt semmi baj, amiért nem válaszolunk az üzenetre, amit 10 perce küldött. Ebéd után már jön a gondolat, hogy a Tinderen találjunk rá az aznap esti hercegre fehér lovon. Munka után elmegyünk futni, ahol a múlt heti edzéshez képesti javulást a RunKeeper mutatja, majd a Yelpen kiválasztjuk hova menjünk vacsorázni. Még be sem ültünk a kiválasztott helyre, de már becsekkoltunk a Swarm-on. Ha elégedetlenek voltunk a kiszolgálással, biztos nem hagyjuk azt szó nélkül a Foursquare-en, miközben várjuk az Uber sofőrt, aki hazavisz minket. Aztán vannak, akik még ennél is tovább mennek. Igen, én is! A wifis mérlegem minden reggel küldi a telefonomra a legfrissebb adatokat a testsúlyomról, a testtömeg indexemről, a pulzusomról és a testzsírszázalékom változásáról. Külön applikáció jelzi előre egy svájci biológiai óra pontosságával, hogy mikor fogok legközelebb menstruálni, és a zsebemben lévő lépésszámláló azt is megmutatja, hogy megtettem-e már az aznapra előírt egészségesnek mondott 10000 lépést.

Hívhatjuk a jelenséget lifeloggingnak, quantified selfnek, Y generációnak, digitális forradalomnak vagy betegségnek is, de egy olyan lelkes adatkedvelő számára mint amilyen én is vagyok, mindenképpen izgalmas terep ez az (ön)elemzésre.

Többek között a fentiekben is említett alkalmazások használata révén több gigányi adat gyűlt össze rólam az online térben, amit privát data concierge híján magam kezdtem el elemezni. (Ha az okoskészülékek másik végén lévő szolgáltató marketing vagy egyéb célokra használja fel a rólam megszerzett információt és pénzt csinál belőle, méghozzá jó sokat, én miért ne tehetném ugyanezt?)

Legelőször arra voltam kíváncsi, hogy egy átlagos napon milyen gyakran használom a telefonom. Figyelem, a cikk továbbolvasását csak erős idegzetűeknek ajánlom! Az eredmény ugyanis még számomra is megdöbbentő. Körülbelül április közepe óta figyelem, hogy egy órában hányszor oldom fel a billentyűzárat az okosomon. A logokhoz az IBM SPSS Modeler R node-jai segítségével készítettem vizualizációt, ez látható a képen is. A nyári időszakot leszámítva, amikor óránként „csak” kétszer nyúltam a telefonomhoz, jellemzően 5-ször, 6-szor akár 7-szer is használom a készüléket óránként. Nincs ez másként hétvégén sem, a minimum 4 alkalom ilyenkor is megvan stabilan. A maximumok az óránkénti 12 alkalmat szerencsére nem haladták meg, eddig. 5 percenként akkor oldom fel a telefonomat, ha számomra fontos esemény közeledik (ezeket jelölik a markerek), illetve ebédszünetben is intenzívebben foglalkozom a készülékkel. Mentségemre legyen, hogy nyár óta csökkeni látszik a telefonhasználat, bár az augusztus óta eltelt időszakban is előfordult, hogy 7 és fél percenként feloldottam a billentyűzárat egy órában.

Data or it didn’t happen?! Bárcsak ne lenne, róla adatom, akkor talán meg sem történt volna...

Balogi Csilla
Data Scientist
Clementine Consulting

Megjelent az Adatelemzés IBM SPSS Statistics megoldások alkalmazásával című könyv

Megjelent a legfrissebb magyar nyelvű IBM SPSS Statistics tankönyv, melyet kollégánk, Könyves Tóth Előd lektorált. A könyvhöz az ajánlót a szerző, Jánosa András tollából olvashatják:

Körülöttünk egy informatikai forradalom zajlik. Kevés olyan folyamata, területe van életünknek, melynek eseményeit digitálisan ne rögzítenénk. De a globalizáció, a felgyorsult üzletmenet, a növekvő ügyféligények, egyes szektorok (például bank, távközlés) növekvő szabályozási-megfelelési kényszere, a társadalmi mozgások, de akárcsak a felismerés és adatgyűjtés módszereinek és eljárásainak fejlődése és számos más tényező is az adatmennyiség folyamatos növekedéséhez vezet, s ez a növekedés exponenciális.

Akár az adattömeg mérete, akár az adatokkal ábrázolt jelenségek bonyolultsága, összetettsége, áttekinthetetlensége okán nagyon sok érték marad rejtve. Ezekben az adatokban pedig ott vannak elrejtve a válaszok a gazdaság működésének kulcs kérdéseire. Olyanokra, mint: kik a vevőink, kik alkotják a vevőinknek azt a hányadát, akiktől a bevétel túlnyomó többsége származik, mi a vevőérték, stb. Ezeknek a kérdéseknek a megválaszolása nagyon értékes a gazdálkodó szervezetek számára. A kérdések megválaszolásának a forrása ott lapul a gyűjtött, tárolt adatokban. Először is azonban kell tudni feltenni azt a kérdést, ami fontos. Ahhoz viszont, hogy valóban válaszolni is tudjunk a feltett kérdésekre, az adatoktól el kell jutni a hasznosítható, a kérdést megfogalmazó területre (természet– és társadalom világa, gazdaság, üzleti élet) „visszaforgatható” tudásig. Ebben a feltáró folyamatban az üzleti intelligencia megragadható úgy, mint eszközök, módszerek, technikák összessége, melyek biztosítják, hogy a megkutatott, vagy a vállalati információs vagyonból az üzleti életben, vagy a társadalmi folyamatok alakításában közvetlenül hasznosítható tudásig eljussunk.

Az információ tudássá alakításának folyamatában az adatelemzésnek az egymással kapcsolatban álló információk összegyűjtésében, értelmes szerkezetbe rendezésében, szemléletes megmutatásában, elemzésében, következtetések levonásában, s bizonyos előre látások, kivetítések megfogalmazásában van szerepe.

Az a felismerés, amit az adatelemzés során szerzünk, kiinduló pont kell legyen olyan üzleti tervek készítéséhez, melyek üzleti probléma megoldására irányulnak, végülis hozzá tudnak járulni az üzleti kockázat csökkentéséhez, az értékesítés növeléséhez, a vevői kör jobb eléréséhez, a költségek csökkentéséhez.

Ezért e könyvben egyfelől megoldást kívánok adni bizonyos adott problémák megválaszolását segítő elemzési megoldásokra, de segíteni akarok a megoldások elemzésében, interpretálásában is. Remélem, hogy mindkét területen olyan hozzájárulást tudok adni, amit először ebben a műben találnak meg. Megtalálhatók olyan kérdések magyarázatai, melyekre korábban kevesen tértek ki, s megtalálhatók a mintául szolgáló, megoldás tekintetében útmutató, értelmező elemzések. A megoldások konkrét példákon keresztül kerülnek bemutatásra, s ábrákkal, magyarázatokkal lépésről-lépésre levezetésre, azzal a céllal hogy az olvasó számára követhetők, ellenőrizhetők legyenek.

A könyv megoldásai az IBM SPSS Statistics szoftverrel készültek, mely adatelemző eszközként egyfajta minőségi sztenderdet képez.

A könyv elsősorban tankönyvnek íródott. Remélhetőleg azonban haszonnal forgathatják a gazdálkodó szervezetek elemző munkatársai is, akik munkájukban az adatelemzés módszereinek gyakorlati alkalmazása során feladataik megoldásához módszertani és számítógépes támogatást keresnek.

Context 2017 - Sokszínű adatok

Helyszín információ

Időpont: 2017. november 7.
Helyszín: Budapest, Groupama Aréna

IDEI TÉMÁINK:

SZÖVEGANALITIKA - BESZÉDTECHNOLÓGIA - SPORTANALITIKA - MESTERSÉGES INTELLIGENCIA - WATSON - KOGNITÍV ALKALMAZÁSOK - CRM

Chatbotok, fordítógépek, beszédszintézis, beszéd leiratozás, NLP ás mesterséges intelligencia, mélytanulás, neurális hálók...

Az elmúlt években az alkalmazott nyelvtechnológia és szöveganalitika területén óriási élet zajlik. A napi hírekbe is beszűrődött, állandó beszédtémává vált. A conTEXT-en szeretnénk a szakmai résztvevők, alkalmazók és érdeklődők számára megmutatni néhány friss eredményt és új fejlesztést.

Előadóink, témáink:

  • Körmendi György, a Clementine ügyvezetője a szöveganalitika és adatelemzés jövőjéről, trendjeiről tart bevezető előadást
  • Vada Gergely, a Fusion Vital alapítója előadásával kitekintünk a sportanalitika világába
  • Dévényi Edit, a K&H Csoport analitikus CRM osztályvezetője bemutatja hogyan segíthet a szöveganalitika CRM projektekben
  • Fegyó Tibor, a SpeechTex alapítója a beszédtechnológia alkalmazásairól beszél és érdekes példákat hoz az élő sportközvetítések gépi feliratozásáról
  • Megismerhetjük Watson kognitív megoldásait, már élő alkalmazásokat
  • A Clementine elemzői idén is érdekes szöveganalitikai demókat mutatnak be
  • .. és kiderül az is, hogy kezdi-e már érteni Watson a magyar nyelvet..

 

Program

Indulás előtt a NUN-expedíció

Július 29-én indul az izgalmas Magyar Nun 2015 Expedíció! A 7135 m magas, fenséges csúcs Indiában, Dzsammu és Kasmír területén fekszik, a Himalájához tartozik. Társával, a Kun-nal egy hegységet alkot, közöttük egy 4 km-es havas plató húzódik 5000 méteren. A hegymászók a Nun nyugati gerincén húzódó klasszikus utat teszik meg.

Az expedíció tagjai: Dr. Ágoston Viktor, Csíkos József, Dobó Barna, Gránicz János, Maku László, Markos Huba, Dr. Szász László és Vörös László.

Dr. Ágoston Viktor, aki egyébként is nyitott a technikai újdonságokra, vállalta, hogy az expedíció ideje alatt a Clementine Consulting és a FusionVital által kifejleszett ClemVital módszertan testszenzorát viselve rögzíti az élettani paramétereit. Az így nyert adatokból később modellezhetőek lesznek szervezetének azon sajátosságai, amelyek szoros összefüggést mutatnak a stressz reakciók, a pihenés-feltöltődés és a fizikai aktivitásoknak az általános egészségi állapotra való hatásaival. A 10 napos akklimatizációs periódus alatt, illetve az azt követő alaptáborba való megérkezés és a csúcstámadás alatt is végez majd méréseket a szenzor, és az így összegyűjtött biostatisztikai adatokat később az ELTE kutatóival együtt elemezik majd a Clementine Consulting és a FusionVital szakemberei.

A hegymászók a mi szenzorainkon kívül más eszközökkel is fognak adatokat rögzíteni, amelyek végső összehasonlítása számunkra is hasznos tapasztalattal fog szolgálni. Ezen kívül természetesen az extrém körülmények között rögzített értékek elemzése önmagában is egyedülálló lehetőség.

Izgatottan várjuk az eredményeket, az expedíció tagjainak pedig ezúton is sok sikert kívánunk!

Bővebben a ClemVital szolgáltatásról

Forrás: Fókablog