Gartner 2017: Magic Quadrant for Data Science Platforms

A data science platformok gépi tanuláson alapuló megoldások létrehozására szolgálnak. Ezen a piacon az innovációk fókusza főleg a felhőmegoldásokra, Apach Spark-ra, automatizálásra, kollaborációra és a mesterséges intelligenciára helyeződik. A Gartner idén is 16 vendort értékelt azért, hogy bemutassa a legjobb elérhető platformokat. Ezek a termékek hozzásegítik a vállalatokat, hogy saját maguk építsenek gépi tanulásos megoldásokat ahelyett, hogy kiszerveznék azok létrehozását vagy éppen készen kapható formában vásárolnák meg őket.

A vállalatok életében felmerülő számtalan feladat elvégzésére alkalmasak ezek a megoldások, különösen olyan esetekben, amikor nem érhetők el megfelelő minőségű készen kapható, csomagolt applikációk. Ilyen feladatok például az ügyfelek igényének, a vásárlási szándékának vagy épp a lemorzsolódásának előrejelzése, illetve a csalásfelderítés.

A Gartner korábban Advanced Analytics Platform kategóriában értékelte a fenti megoldásokat, azonban a fejlett analitika kifejezés egyre inkább kikopott mióta a vendorok szívesebben használják a data science-t a marketing narratívájukban. Emellett a Gartner azzal is érvel az új elnevezés mellett, hogy az értékelt platformokat data scientist-ek használják, így kézenfekvő a szóhasználat. A definíciójuk szerint a data science platformok olyan összetett szoftveres applikációk, amik számtalan adatelemzési megoldás létrehozására alkalmas alapvető építőköveket tartalmaznak, és képesek ezen megoldások üzleti folyamatokba, infrastruktúrába és termékekbe történő beépítésére.

15 kritérium mentén értékelték a platformokat, úgy mint adat-hozzáférés, -előkészítés, vizualizáció, automatizálás, user interface, gépi tanulás, stb. A korábbi évekhez hasonlóan a megjelenítés komplexitása és a végrehajtás képessége mentén helyezték 4 kvadránsba az eredményeket, és az IBM ismét kiemelkedő helyet foglal el a Leader-ek között. A cég két termékét, az SPSS Modelert és az SPSS Statistics-et vették számításba az értékelésnél.

gartner 2017

A jelentésben az IBM alábbi erősségeit emelték ki:

  • Az IBM elkötelezett a folyamatos fejlesztés, illetve a data science és gépi tanulásos módszerek kiterjesztése iránt. A legújabb data science platform, a Data Science Experience (DSx) a jövőben minden bizonnyal a legkedveltebb eszközzé válhat a modern, nyitott, rugalmas használhatóságának köszönhetően, illetve azért is, mert az adatelemző szakértőktől az üzleti felhasználókig mindenki számára könnyen használható megoldásokat kínál.
  • Az IBM nagy hangsúlyt fektet az open source megoldások integrálására, hiszen ez napjainkban alapvető elvárás az adatelemzésben. Támogatja többek között a Spark és más nyílt forrású technológiák szoftveren belüli elérését, valamint az SPSS felhasználóknak több mint 170 bővítményhez is hozzáférést enged, hogy ők külső (akár más programnyelven írt) applikációkat és algoritmusokat használva tegyék még hatékonyabbá elemzéseiket. Az IBM számos open source társulásnak is a tagja, ilyenek például a Databricks, H2O.ai és a Continuum Analytics.
  • Az IBM a forrásadatok széles skáláját támogatja, köztük például a strukturálatlan adatok feldolgozását is, emiatt kedvelt eszköz a data scientistek körében. Az SPSS támogatja az összes vezető Hadoop, NoSQL és más relációs adatbázishoz való kapcsolódást. Gond nélkül kezel sok adatot, és párhuzamosan futó elemzéseket is.
  • A megkérdezett IBM felhasználók kitűnőnek értékelték az SPSS modellezési képességeit, kiemelve az elemzéseknél elérhető modellek széles skáláját, azok pontosságát, a modellek alkalmazhatóságát, a megbízhatóság romlásának nyomon követhetőségét és a javítási lehetőségeket. Továbbá az SPSS jól szabályozott, konzisztens analitikai környezetet biztosít, amelyben könnyen nyomon követhetők a verzióváltások, a metaadatok és az ellenőrzési lehetőségek.

Forrás: Gartner