Skip to main content

Kutatás

sajtó csomag

Töltse le a Clementine bemutatkozó anyagát.

SAJTÓKAPCSOLAT

E-mail: Ez az e-mail-cím a szpemrobotok elleni védelem alatt áll. Megtekintéséhez engedélyeznie kell a JavaScript használatát.
Tel: +36 1 457 0561
Fax: +36 1 457 0562
Cím: 1115 Budapest,
Bartók Béla út 105-113.

Adatbányászat: az adatokban rejlő erő

Adatbányászat: az adatokban rejlő erő

2022. július 19.

Az adatok korában nem az a kérdés, hogy valamiről megfelelő mennyiségű adattal rendelkezünk-e, hanem az, hogy be tudjuk-e mindezt fogadni és képesek vagyunk-e a megfelelő módon feldolgozni, értelmezni, vagyis tudunk-e információt csiholni az adatokból. Az adatbányászat az információkinyerés eszköze. 

Az adatbányászat iránti igény kialakulása
Ahogy növekedett a tárolókapacitás, egyre inkább növekedett a tárolt adatok mennyisége. Hatalmas adathalmazok gyűltek össze, a cégek azonban nem tudtak ezekből hatékonyan információt kinyerni. A gépi tanuló algoritmusok segítségével azonban ezen a problémán felül lehetett kerekedni, a nagy adatbázisokat meg lehetett „regulázni” és olyan információkat kinyerni belőlük, amik jelentős segítséget nyújtanak a döntéshozatalhoz, az üzleti folyamatokhoz.

Az adatbányászat célja
Alapvető igazság, hogy minél több információ áll rendelkezésre, annál nehezebb köztük navigálni, annál bonyolultabb folyamat útján lehet megtalálni azt, amire szükségünk van. Az adatbányászat kifejezés magában hordozza, hogy az adatok ugyan rendelkezésre állnak, mégis azok megszerzése, a megfelelők kiválasztása óriási és kihívásokkal teli feladat.

Az adatbányászat angol elnevezése Data Mining, de találkozhatunk a Knowledge Discovery in Data (KDD) kifejezéssel is. Az adatbányászat célja, hogy az adatokban rejlő információ elérhető legyen a szervezet számára, és hozzásegítse egy adott probléma megoldásához, a trendek előrejelzéséhez, az ügyfelek viselkedésének mélyebb megismeréséhez, a további fejlesztési lehetőségek megtalálásához.

Az adatbányászat tehát nem más, mint új, érdekes, értékes és értelmes összefüggések feltárása nagy adathalmazokban. Komplex tevékenység, mely egyszerre igényel informatikai és matematikai ismereteket, valamint üzleti tudást. Az eredményeknek akkor van értelme, ha az elkészült elemzés, modell, előrejelzés beilleszthető a szervezeti és operatív folyamatokba, a döntéshozatalba.

Az adatbányászat legáltalánosabb felhasználási területei az ügyfélszerzés és megtartás (elvándorlás előrejelzés), ügyfél életciklus értéknövelés, kockázatkezelés, csalások felderítése és megelőzése, terméktervezés.

Adatbányászati folyamat
Minden adatbányászati projekt más és más, de biztosan valamilyen módszertan alapján zajlik. Máig a legelterjedtebb adatbányászati módszertan a CRISP-DM, vegyük sorra a lépéseit!

Az üzleti cél meghatározása
Az első és legfontosabb lépés az üzleti célok feltérképezése, megismerése. Tisztában kell lenni a környezet sajátosságaival, kulcsfontosságú a kezdeti üzleti cél pontos meghatározása, a lehetőségek és korlátok felmérése, valamint az eredmény felhasználásának tervezése.

Adatok megértése
Következő lépésként „elő kell keríteni” azokat az adatokat, amelyekre szükség van az üzleti célok eléréséhez, fel kell mérni ezek milyen jellegű adatok, milyen tulajdonságaik vannak, alkalmasak-e a célok eléréséhez.

Adatok előkészítése
Az adatbányászati projektek esetében a telkes projektidő kb. 60-70%-át teszi ki ez a fázis: ahhoz, hogy az eredmények pontosak legyenek, az adatokat megfelelően elő kell készíteni. A folyamat során ki kell választani a modellezéshez használt adatokat, kezelni kell a hiányzó értékeket, új paramétereket kell bevezetni és ki kell alakítani a megfelelő adatformátumot.

Modellezés
Az előző fázisban előkészített adatokon „már csak” alkalmazni kell az adatbányászati szoftverek eszköztárát, tesztelni mely modellek, algoritmusok teljesítenek jobban. A „low-code” adatbányászati termékek – mint az SPSS Modeler – beépített algoritmusai egyszerűen paraméterezhetők, a pontosságuk gyorsan mérhető és összehasonlítható.

Üzleti szempontú értékelés
Ha megvannak az eredmények, akkor jöhet az értékelés. Az, hogy egy modell matematikailag jó, nem feltétlenül jelenti, hogy üzletileg is jól alkalmazható. Az elemző feladata annak felmérése, hogy a modellezés során kapott eredmények mennyire alkalmasak az üzleti célok elérésére, a meghatározott probléma megoldására.

Alkalmazás
Végül megtörténik az eredmények alkalmazás, vagyis a való életbe ültetése. Ennek legegyszerűbb módja, hogy az eredményeket átadják egy döntéshozónak, aki majd felhasználja az információkat a megfelelő pillanatban, vagy beépítik például egy kampánymenedzsment eszközbe, mely közvetlenül használja a modell eredményeit.

Az adatbányászat előnyei
Az adatbányászat számos előnnyel kecsegtet, amelyek miatt nem kérdés, érdemes nagyobb figyelmet szentelni neki. Támogatja a döntések meghozatalát és azt is, hogy a vállalat a célok elérése felé haladjon.

Az adatbányászat lehetővé teszi, hogy megismerjük a fennálló helyzet, a környezetet és modellezzük, hogy milyen kimenetek várhatók a jövőben. A Clementine mindehhez az IBM SPSS Modelert használja, ami egy igen népszerű szoftver szerte a világon. Kattints, és ismerd meg, miként állítja csatasorba a Clementine az IBM SPSS Modelert!