Hírek

Ilyen volt a conTEXT 2019

Rendezvény
2019.12.03. 01:22

„Értékes gondolatokhoz minőségi forma dukál” - gondolták a Clementine munkatársai, akik idén is egy kiemelkedő helyszínre, a CEU Nádor utcai, pazar épületébe hívták a szöveganalitika iránt érdeklődőket, a 2019-es conTEXT konferenciára.

Az előadássorozatot ezúttal is Körmendi György, a Clementine ügyvezetője nyitotta meg, olyan kérdéseket feszegetve, mint a 2019-es év iparági tanulságai és a 2020-ban várható trendek. Előbbiek között az adatokkal gigászi méretekben dolgozó nagyvállalatok politikához való egyre feszültebb viszonyát, a kapcsolódó jogi szabályozásokat és a hibrid cloudtechnológia térnyerését említette, mig a jövővel kapcsolatosan a “mesterséges intelligencia”-sikersztori végét, az alacsony számú sikeres MI-projekt felértékelődését és az adatbiztonság szempontjából megbízható Enterprise Data Platformok térhódítását vizionálta.

conTEXT Körmendi György
„Van-e még szükség nyelvészekre?”, tette fel előadásában a kérdést Kálmán László, a Nyelvtudományi Intézet munkatársa. A szakértő szavaiból ítélve joggal aggódhatnak választott munkájuk miatt a területen dolgozók: a klasszikus nyelvszemlélet – szó alapelem, toldalék, mondattan –, valamint az adattudomány és technológia által a nyelvet érintő módszertani megközelítés – adathalmazok, feldolgozás, alkalmazás – valóban összeegyeztethetetlennek tűnnek. Azonban létezik egy olyan nyelvészeti irányzat, amely képes feloldani az ellentmondást, és megmutathatja a jövőt a kutatók számára: ez a ’használat alapú’ nyelvészet, amely a nyelvtudást gyakorlatilag egy velünk, a tapasztalásainkkal együtt fejlődő nyelvi emléknyomok gyűjteményének tartja. A kiutat az irányzat és a technológia által is vizsgált, értelmezett elemek – a nagy adathalmaz, az emléknyomok, a kapcsolat erőssége – jelentik, a két ág ezek mentén tud azonos, egymást segítő kutatásokat végezni. Az emberi agy által alkalmazott legrelevánsabb emlékképet viszont a gépek sok esetben nem tudják meghatározni, mert nem képesek értelmezni a lélek rezdüléseit. Talán nem véletlen fogalmazott úgy a gép a Terminátor 2-ben, hogy bár tudja, miért sírnak az emberek, de ő sosem lesz képes erre.

Dr. Mihajlik Péter, a BME oktatója a „Mesterséges Intelligencia a beszédtartalom felismerésében” címmel tartott előadásában felidézte, hogy az MI már az 1970-es évek óta szerepet játszik az automatikus beszédfelismerésben (ASR). A „jelfeldolgozás – hangmodell – kiejtési szótár – morfológia” modelljét vizsgálva érdekességként megállapítható, hogy mondatszerkezeti szempontból a magyar nyelv közelebb áll a török és arab nyelvekhez, mint a finnugor ’rokonokhoz’. Megtudtuk, hogy a technológia fejlődésével erősödő számítási lehetőségek kedveztek a Deep Learning alapú spontán szófelismerésnek. A Deep Nyelvtan módszertana szerint a kutatás során a régi szabályokra nincs szükség, ezek elhagyásával az ASR pontossági aránya fokozható. A szakember a talktotransformer.com weboldal kipróbálását javasolta a közönségnek: az online rendszer egy megadott mondat alapján megjósolja a témában következőt. A látványos bemutató mögötti technológiák kutatása manapság nagyon népszerű, azonban a rendkívüli erőforrásigény miatt ipari méretben történő gyakorlati alkalmazásuk egyelőre nem aktuális.

Mi lehet a kérdés?” – töprengett már a címben Pázmándi Eszter. A Clementine elemzője egy banki ügyfélkiszolgálás támogatást érintő probléma és az arra kialakított megoldás bemutatásával világított rá arra, hogy a szöveganalitika milyen támogatást nyújthat a területen jelentkező belső tudásmegosztással kapcsolatos kihívások kezelésében. A projekt során a Clementine a meglévő céges dokumentumokból és a beérkező levelekből gyűjtött kérdések-válasz párokból egy tudásbázist, valamint egy keresőt épített IBM SPSS Modeler alapokon. A folyamat részét képezte a szöveges források feldolgozása, a szótárépítés, a szövegelemzés, valamint a kulcsszavak azonosítása. A jelenleg tesztüzemben futó megoldás minden további, hasonló problémához reprodukálható, az érintett szervezetek humánerőforrás-állománya pedig tehermentesíthető.
 
“Ezt már mondtad?” - hangzott el egy újabb kérdés előadáscímként, a Clementine két elemzőjeMolnár-Edőcs Eszter és Mészáros Evelin részéről. A hölgyek a 2018-as conTEXT során bemutatott AVATAR-rendszer továbbfejlesztését jelentő munkálatok részleteibe avatták be a közönséget. A vállalati hitelbírálati folyamatokat támogató megoldást kellett további, az egyes esetekből származó tudással gazdagítani. Az alkalmazott módszertan egy olyan specifikus, magyar nyelvű szótár létrehozását jelentette, amely beépül a már működő AVATAR-ba. A mindennapokban a rendszer egyre több kérelemnél képes lesz a bírálatokat végzők döntéseit önállóan értelmezni, illetve minden új információt megtanulni, és az így szerzett tudást a későbbiekben hasznosítani.
conTEXT résztvevők
Az IBM képviseletében Huszti Dániel „Szöveganalitika (r)evolúció és az intelligens rendszerek kapcsolata” címmel tartott előadásában rámutatott, hogy a természetes emberi nyelv feldolgozásával lehetőség nyílik a mindennapi munka szignifikáns felgyorsítására. A jövőt egyértelműen az önkiszolgáló rendszerek széles körű nagyvállalati alkalmazásában látja az ügyfélszolgálat, a belső információmegosztás, a döntéstámogató üzleti elemzések, valamint a virtuális asszisztensek formájában. Az elképzelhető legtökéletesebb megoldást természetesen a fenti területek kombinációja jelentheti egy adott szervezet számára. Az IBM által fejlesztett Watson Discovery Platformot a Forrester idén a „Leaders in Cognitive Search” elismeréssel illette.

A kiadós ebéd után két további előadással folytatódott a program. „Kulturális jelenségek vizsgálata szóbeágyazási modellekkel” címmel Dr. Koltai Júlia és Dr. Kmetty Zoltán, az ELTE és a Boldy munkatársai konkrét, a közösségi média világában született szövegek elemzésén keresztül igazolták, hogy a nyelv utal használói kulturális rendszerére. Az általuk alkalmazott módszertan segítségével egy sokdimenziós vektortérben képesek feltárni a szavak közötti összefüggéseket. Bemutatták például, hogy egy-egy ország és annak vezetője milyen szorosan összefügg az emberek gondolatait leképező nyelvben. A felépített modell segítségével kimutatható a nemek és a társadalomban elfoglalt pozíciójuk közötti összefüggés vagy feltárhatók egy adott korra jellemző politikai diskurzusok sajátosságai is. Előadásuk végén az Instagram #-eit elemző Travelgram kutatásuk alapján érzékeltették, hogyan képesek a helyesen feldolgozott adatok támogatni akár a városmarketinget érintő döntéseket is.

A napot Bolonyai Flóra, az ELTE mesterképzésének végzős hallgatója zárta, aki a „Felhasználók profilozása – Twitter felhasználók szövegalapú nem szerinti kategorizálása” címmel készíti diplomamunkáját. Előadásából megtudtuk, hogy az ilyen jellegű kutatások – elsősorban a platform szűk hazai felhasználása miatt főleg angol nyelven zajlanak. A módszertan alkalmazható a marketing, a véleménybányászat, a bűnügyi nyelvészet, de akár a szociológia területén is, ahol a szövegek (tweetek) elemzésével vizsgálható többek között a nők társadalmi alárendeltsége is. Megtudtuk, hogy a közösségi médiában nemcsak a leírt szavak, mondatok segítik az elemzők munkáját, hanem sok alkalommal az emojik is, bár ez utóbbiak nem minden esetben igazodnak az adott kontextushoz, így inkább zavarják a kutatók tisztánlátását.
Tovább olvasom »

Tovább olvasom »

Tovább olvasom »

Tovább olvasom »