Skip to main content

Vélemény

sajtó csomag

Töltse le a Clementine bemutatkozó anyagát.

SAJTÓKAPCSOLAT

E-mail: This email address is being protected from spambots. You need JavaScript enabled to view it.
Tel: +36 1 457 0561
Fax: +36 1 457 0562
Cím: 1115 Budapest,
Bartók Béla út 105-113.

Milyen problémára nyújt megoldást az IBM Watson Studio?

Milyen problémára nyújt megoldást az IBM Watson Studio?

25 July 2019.
Hogyan tud könnyedén együtt dolgozni több, eltérő eszközt használó elemző úgy, hogy a részfeladataik közötti integráció a lehető legnagyobb legyen? Hogyan lehet a projektért felelős, valamint más személyeket kellőképpen bevonni egy egységes rendszerbe?,

Egy adatbányászati projekthez rengeteg erőforrás kell. Ezek körébe tartoznak triviálisan az analizálni kívánt adatok, de a különböző modellezési eszközök, a modellek, pipeline-ok vagy akár maguk az elemzők is ide tartoznak. Látható, hogy ezek menedzselése, felügyelet alatt tartása nem egyszerű folyamat. Sokszor a menedzsereknek, product ownereknek, valamint egyéb szereplőknek sincs megfelelő rálátásuk a feladatra, kicsúszik a kezük alól az irányítás, vagy esetleg nem tudják úgy végezni a feladataikat, mint ahogy az tőlük el van várva.

Egy-egy elemzési feladat több részfeladatra tagolható, mint adatbetöltés, adatok megismerése, adattisztítás, elemzés, vizualizáció, integrálás, üzemeltetés, eredmények kiértékelése, stb. Az adatbányászat opensource eszközeinek, valamint nyílt közösségének köszönhetően az elemzők sok különböző eszközt ismernek, továbbá mindenkinek megvan a saját kedvenc eszközkészlete, amellyel a leghatékonyabb, amelyet a legszívesebben használ. Ha ehhez hozzávesszük, hogy a gyártók, illetve cégek által kínált különböző eszközök és megoldások közül sem mindegy, hogy egy adott probléma során melyiket használjuk, akkor láthatóvá válik, hogy ez még tovább bonyolítja a projektek kezelhetőségét, integritását. Hogyan tud könnyedén együtt dolgozni több, eltérő eszközt használó elemző úgy, hogy a részfeladataik közötti integráció a lehető legnagyobb legyen? Hogyan lehet a projektért felelős, valamint más személyeket kellőképpen bevonni egy egységes rendszerbe?

Az IBM Watson Studio terméke ezekre a problémákra kínál megoldást.

A termék középpontjában egy projekt áll, mely a valós adatelemzési projektünket reprezentálja. Egy-egy projekt pedig különböző részelemekből épül fel, valamint különböző entitások rendelhetők hozzá. Maga a termék képes tisztán cloudos, hibrid cloudos, úgynevezett on-premise módon, valamint dedikált desktop alkalmazás keretein belül is futni.

A projekthez tartozik egy speciális Cloud object Storage tárrendszer, amelybe lehetőség van a saját lokális adataink feltöltésére, de különböző külső adatforrásokat is hozzácsatolhatunk a projekthez, legyen az egy folyamatos adatfolyamot szolgáltató stream adatforrás, vagy akár adatbázis.

A Watson Studio-ban található Data Refinery az adatok megismeréséhez, illetve tisztításához használható. Segítségével az adatelemzés scope-jában kevésbé jártas személyek is könnyen betekintést nyerhetnek az adatok struktúrájába, egyszerűen végrehajthatnak különböző adattisztítási lépéseket, valamint beszédes ábrákat hozhatnak létre az integrált vizualizációs eszköz segítségével. Az adatelemzéshez továbbá használhatunk különböző, általunk konfigurálható környezettel rendelkező notebookokat, melyekben R, Python, vagy Scala nyelven is végrehajthatjuk az elemzést, akár Sparkos módon is. A folytonosan érkező stream adatfolyamot a Streaming Analytics keretein belül elemezhetjük. Továbbá az SPSS Modelerhez nagyon hasonló Modeler Flow Editor felületen tudunk a Modeler streamekkel analóg, úgynevezett flow-kat, valamint különböző neurális háló architektúrákat létrehozni. Itt a hálókban használt különböző technikák, metrikák, valamint egyéb entitások vannak leképezve node-okra. Az elkészített hálót betanítva pedig különböző szolgáltatásként tudjuk deploy-olni a hálózat képességeit, legyen az akár egy webservice, vagy egy CoreML-t használó applikációhoz szükséges virtual container. A hálózatok betanításához, optimalizálásához, eredményeik összehasonlításához az Experiment Buildert használhatjuk. Miután a betanított modelleinket üzembe helyeztük, az eredményeket az üzlet szempontjából is meg kell vizsgálni, melyeket általában dashboardokon ábrázolunk. A Watson Studio-ban ezt a feladatot az Analytics Dashboard integrált eszközzel lehet végrehajtani.

Különböző speciális problémákra dedikált megoldásokat tartalmaz a Watson Studio. A természetes nyelvvel kapcsolatos feladatokhoz Natural Language Understanding, Natural Language Classifier, a döntésoptimalizáláshoz CPLEX engine, míg a képi felismerési feladatokhoz Visual Recognition modulok érhetők el.

Összefoglalásként tehát látható, hogy az adatelemzés által prezentált változatos problémákra és feladatokra a Watson Studio többféle, ám egymással szoros kapcsolatban lévő megoldást nyújt, az integrált eszközök képében. Az egész elemzési feladatot pedig egy összetartozó, felügyelhető egységgé képes alakítani.