Mi az R?
Az R egy open source programozási nyelv és szoftveres környezet statisztikai számítások és grafikák készítéséhez. Az R nyelv főként statisztikusok és adatbányászok között népszerű, akik a statisztikai programjaik fejlesztésére használják azt, de ezen felül is széles körben használt eszköz haladó adatelemzéshez. Olyan átfogó statisztikai és grafikai technikákra képes, mint a lineáris és nem lineáris modellezés, klasszikus statisztikai próbák, idősoros elemzések, klasszifikáció és klaszterezés statisztikai számítások és grafikák készítéséhez. Az R nyelv főként statisztikusok és adatbányászok között népszerű, akik a statisztikai programjaik fejlesztésére használják azt, de ezen felül is széles körben használt eszköz haladó adatelemzéshez. Olyan átfogó statisztikai és grafikai technikákra képes, mint a lineáris és nem lineáris modellezés, klasszikus statisztikai próbák, idősoros elemzések, klasszifikáció és klaszterezés.
Az R számos elérhető csomagja ökonometria, adatbányászat, térelemzés, bioinformatika és egyéb területen specializált. Elismert statisztikusok illetve informatikai szakemberek felülvizsgálata alatt működik, ám open source mivolta miatt az egyes verziók és csomagok folyamatai nem szigorúan szabályozottak.
SPSS Modeler és R
Az R kódok tovább erősítik a szoftver már meglévő adatmanipulációs, statisztikai analízis és prediktív előrejelző képességeit. Az R kiegészítő csomagok lehetővé teszik a Modeler-ben nem létező algoritmusok használatát is. R csomagok használatával hatékonyabbá válik az adat vizualizáció, jobban paraméterezhetőek az algoritmusok.
A Modeler-ben létre tudunk hozni saját, R nyelven írt node-okat a Custom Node Dialog Builder segítségével. Megtehető ugyanez a palettákon található Extension node-ok használatával is. Az így létrehozott R node-ok megoszthatók más felhasználókkal, akik maguk nem programozzák az elemzéseiket, de profitálhatnak az új lehetőségből. Így a fejlesztők a kódok írására, míg a felhasználók az elemzésre fókuszálhatnak, miközben a kibővített R funkcionalitást élvezik az R megtanulása nélkül.
Az R integrálásának előnyei
Az SPSS Modeler nagyszerű platformot biztosít arra, hogy az R felhasználók nagy adathalmazokat elemezhessenek, vizualizációkat és egyéb outputokat hozhassanak létre. Az integráció további előnye a Modeler egyszerű használata és az integrált R csomagok megosztása a programozásban járatlan kollégákkal.
Biztonság
Az R esetében a formális forgalomba hozatal hiánya miatt nem beszélhetünk minőségbiztosításról, tehát csupán saját felelősségre használható, és nem garantált a funkciók hibátlan működése. Ezzel szemben azonban a Modeler az IBM szoftvereként szigorú minőségbiztosítási folyamaton megy keresztül, amely szavatolja a vállalati adatok biztonságát.
Összegzés
Az R felhasználók az SPSS szoftverekkel kiváló adatkezeléshez, vizuális interaktív felülethez, prezentáció minőségű outputhoz és fejlettebb skálázhatósághoz jutnak hozzá, az SPSS felhasználók pedig egy gazdag, folyamatosan bővülő eszköztárat kapnak az adataik mélyebb megértéséhez.