Sokszínű adatok

A 2017-es conTEXT konferencia a hagyományoknak megfelelően a legújabb szöveganalitikai megoldásokról és lehetőségekről szólt, a beszédtechnológia, a sportanalitika, a mesterséges intelligencia vagy éppen a kognitív alkalmazások oldaláról.

A teltházas rendezvény megnyitójában Körmendi György, a Clementine ügyvezetője a szöveganalitikai helyzet változásairól beszélt, mely az elmúlt egy évben is számos újdonságot tartogatott. A chatbotok működését, az interfaceket, vagy éppen a teljes technológiát befolyásoló újdonságok és lehetőségek bemutatásával komplex képet kaptunk az iparág helyzetéről, a felmerülő „merre tovább?” kérdésekről.

Dévényi Edit, a K&H csoport analitikus CRM osztályvezetője 10 olyan megoldást mutatott be, amelyen keresztül a szöveganalitika támogathatja a CRM működését, illetve hozzájárulhat az ügyfélélmény javításához. Megoldásai között szerepelt a chatbotok használata, a geo- és hálózatanalitikai megoldások alkalmazása továbbá a felhasználók érzelmeinek, élményeinek és egymásra vetített hatásainak vizsgálata is. Az általa bemutatott megoldások nagyban segítik azokat az elemzési folyamatokat, amelyek az ügyfél számára legmegfelelőbb ajánlat kidolgozásra hivatottak.

Vada Gergely, a Fusion Vital alapítója előadásában strukturálatlan humán fiziológiai adatok elemzésén alapuló esettanulmányokat mutatott be a profi sport, a fegyveres erők és a civil élet területéről. Kutatásaik, projektjeik során ugyanis szívdobbanások milliárdjainak elemzésén keresztül vizsgálták, hogy mit jelentenek a gyakorlatban azok az elvont fogalmak, mint „sportolói teljesítőképesség”, „ismételt bevethetőség” a katonaságnál vagy „egészséges életvitel” a mindennapokban. Mint kiderült, a pulzusvarianca elemzésével rengeteg értékes adat kinyerhető: a fizikai terhelés, a restitúciós folyamatok eredményessége, az éjszakai regeneráció vagy a mentális felkészültség mind-mind megmutatkozik a pulzus mintázatában, amely ma már könnyen hozzáférhető. Ráadásul nem csupán sportolás vagy egyéb terhelés közben, hanem az új technológia segítségével hasznos információk gyűjthetők a sportoló mindennapjait 80%-ban kitevő, az edzők által közvetlenül kontrolálhatatlan, korábban homályban maradó időszakokról, tevékenységekről (szabadidő, alvás, étkezés, életmód, munka, pihenés, pszichés sajátosságok) is.

Boa László, az IBM cloud architect szakértője Watson chatbot implementációk tanulságairól beszélt. Olyan gyakorlati példákat muatott be, amelyek a mindennapjainkra is nagy hatással vannak, például a vércukormérés területén. A páciensek ugyanis adataik segítségével már nem csak valós idejű betekintést kapnak állapotukba, de Watson segíthet előrejelzéseket készíteni, vagy éppen a kritikus döntések meghozatalában. Az ilyen és ehhez hasonló, személyre szabott megoldások ma már egyre szélesebb körben és egyre több szektorban elterjedtek, miközben kiválóan integrálják az analitikai, mobil, közösségi, biztonsági és felhő technológiákat.

Pancza Judit, a Clementine szöveganalitikai szakértője sorra vette az IBM SPSS Modeler valamint a Watson Explorer hasonlóságait és eltéréseit, a szótáralkotás, a vizualizáció, a felhasználók vagy éppen az alkalmazási lehetőségek szemszögéből. Az így kialakult összehasonlítás nyomán egy speciális demot mutatott be, amely - hibrid megoldásként - a két szoftver legjobb tulajdonságait ötvözve képes hatékony szöveganalitikai elemzésekre, valamint azok vizualizálására


Fegyó Tibor, a SpeechTex ügyvezetője előadásában bemutatta, hogy hol tart jelenleg a magyar nyelvű élőbeszéd leiratozása, milyen speech-to-text eljárások léteznek, ezek milyen erősségekkel illetve hiányosságokkal bírnak. Emellett megismertette a jelenlévőkkel a speech-to-text egy érdekes és összetett fejlesztési területével, a sport közvetítések valós idejű leiratozásával. A gyakorlati életből hozott példáin keresztül láthattuk, hogy milyen komplex és egyben szakterület specifikus tudással kell rendelkeznie egy programnak már egy futballmeccs pontos leiratozásához is.

Sztahó Dávid, a BMT TMIT kutatója újra megerősített mindenkit abban, hogy a beszédünkben rejlő nem-verbális információ sok mindent elárul rólunk. A beszéd a természetes kommunikációnk egyik alapvető eszköze, ám ezen kívül a hangok képzését befolyásolja a mindenkori egészségi és érzelmi állapotunk is. Az előadás során a résztvevők megismerhették a hang-alapú érzelem azonosítás során fellépő feladatokat, a felismerés információtechnológiai folyamatát, az alkalmazás gyakorlati problémáit, valamint a jelenlegi state-of-the-art megoldásokat. A gyakorlati alkalmazási területek és a felmerülő gyakorlati problémák bemutatása betekintést nyújtott a téma iránt érdeklődők számára.

A Precognox képviseletében Ilyés Virág (Data Scientist), Katona Eszter (Junior Data Scientist) valamint Varjú Zoltán (Head of Data Science) mutatták be tartalomelemzési kutatási projektjüket. Azt mindenki tudja, hogy a sajtóban megjelenő cikkek nem csak szöveges információt tartalmaznak, egy írás nem csak nyelvi, hanem képi eszközökkel is él. De vajon ugyanolyan módon tematizálják-e az egyes híroldalak szöveges és képi tartalmai a tárgyalt témákat? Kutatásuk során a migrációs válság kapcsán a hazai online médiában megjelent több mint negyvenezer cikket és a hozzájuk tartozó majd' tízezer képet elemezték, hogy megtudják a választ az author-topic model eljárás segítségével.

A konferencia zárásaként Máté Anna, a Clementine elemzője a nyári slágerek világába kalauzolt mindenkit – természetesen a szöveganalitika irányából. Kutatásában a dalszövegekből létrehozott adatbázis az SPSS Modeler szoftverben került tisztításra, -rendszerezésre, majd a Text Analytics megoldás segítségével specifikus szótárt készített. Előadásában ezen szótár létrehozásának kihívásait részletezte a magyar nyelvben található egyalakú- és hasonló alakú szavak, a homonimák vagy éppen a több jelentés problémájának kiszűrésével. A megoldásokat három irányból is bemutatta: szinonima, kézi szabály valamint szófaj alapján. Az elemzés végére pedig az is kiderült, hogy milyen szavakat, kifejezéseket használnak a magyar könnyűzenei élet szereplői a legmenőbb nyári slágerek megalkotásához.