Szoftverek használata a workshopokon

A workshopokat - melyek tulajdonképpen rövidített tanfolyamok - mindenki a saját számítógépén tudja majd követni, ezért kérjük hozza magával azt.

A szükséges szoftverek 14 napos próbaverzióit a Nyári Iskola előtt letölthetővé tesszük. Kérjük, hogy a workshopok előtt telepítsék azokat. Ha a telepítés során probléma merült fel, kollégáink segítenek a nyariiskola@clementine.hu e-mail címen! Helyszíni telepítésre az idő szűke miatt nem lesz lehetőség.

Szoftverek elérhetősége (hamarosan)

Workshop leírások

Bevezetés az SPSS Modelerbe 1-2. (egymásra épülő, egyben elvégzendő)

 A workshop nehézsége: kezdő

Közismert, hogy az adatelőkészítés folyamata sok esetben az egyik legidőigényesebb feladat egy elemzés során, mégis érdemes kellően precíznek lennünk, hiszen az adataink minősége és az adattábláink rendezettsége nagymértékben befolyásolják a további munkánk sikerességét. Az Adatkezelés és adat transzformációk az SPSS Modelerben workshop keretében ezt a témát járjuk körbe, miközben megismerkedünk az SPSS Modeler szoftver logikájának és használatának alapjaival is. A kurzus során egy gyakorlati példán keresztül nézzük meg a különböző adatforrások beolvasására, az adatok mérési szintjének beállítására, az adatminőség ellenőrzésére, az adatok szűrésére szolgáló lehetőségeket, valamint feltérképezzük az adattranszformációs és a különböző adattáblák összekapcsolására szolgáló megoldásokat is

A kurzust elsősorban azoknak ajánljuk, akik korábban nem használtak SPSS Modeler szoftvert, de szívesen ismerkednének a világviszonylatban is egyik legnépszerűbb adatbányászati szoftverrel, illetve érdeklődnek az adatelőkészítés témája iránt.

Adatbányászat a gyakorlatban - esettanulmány

A workshop nehézsége: haladó

Előfeltétel: SPSS Modeler ismerete

A kurzust elősorban azoknak ajánljuk, akik ismerik az SPSS Modelert és szeretnék végigkövetni egy esettanulmány gyakorlati megvalósítását.  

Python alapú automatizálás a Modelerben

Előfeltételek: Kezdő szintű SPSS Modeler és adatbányászati ismeretek (a "Bevezetés az SPSS Modelerbe" kurzus alatt elsajátítható szint). Python programnyelv ismerete nem szükséges, viszont a jelentkezésnél, kérjük, jelezzék a Python nyelv ismeretének szintjét (nincs, alap, haladó, profi).

Az adatbányászati folyamatok során gyakran hasznos, ha automatizálni tudjuk az egyes részfolyamatokat. Ebben nyújt segítséget az SPSS Modeler Python scripting felülete. A kurzus alatt a résztvevők megismerkednek ezekkel az automatizálási lehetőségekkel, és a Python további Modelerben való alkalmazásaival is. Ilyenek például az alábbiak: file-ok, modulok importálása, interaktív futtatás, grafikus komponensek (Jawa Swing, AWT modulok), Python alapú node-ok létrehozása.

A kurzus nem Python programozói tanfolyam, kizárólag az SPSS Modelerben való alkalmazás a témája.

Szöveganalitika az SPSS Modelerben

A workshop nehézsége: kezdő

Előfeltétel: SPSS Modeler ismerete

A workshop résztvevői megtanulhatják, hogyan alakíthatók a strukturálatlan, szöveges formátumú adatok strukturált, adatbányászati elemzésekhez alkalmas adatokká. Áttekintjük az SPSS Modelert érintő szövegbányászati alapokat, megmutatjuk, hogyan nyerhet ki összefüggéseket dokumentumokból, hogyan tudja ezeket kategorizálni, és hogyan használhatja fel a szövegbányászat eredményeit további adatbányászati elemzésekhez. Bemutatjuk a szótárak, mintázatok és modellek létrehozásának módszerét egy interaktív, grafikus felületen keresztül.

A kurzust azoknak ajánljuk, akik már ismerik a Modelert, és érdeklődnek a szövegbányászati módszerek használata, alkalmazása iránt.

Statistics vs. Modeler

A workshop nehézsége: kezdőknek és haladóknak egyaránt

A cél nem a két eszköz versenyeztetése, hanem a különbségek észrevétele az érdekesség szintjén.

Piackutató szójárással élve a DP (data processing) szintű folyamatok viszontagságai két különböző világban, két látványosan eltérő kezelő felületen.Például a következő helyzetekben:
- cimkézett vagy beszédes nevű változók adatok kezelése
- ciklikus jellegű tevékenységek elvégzése
- egyirányú és szétágazó tevékenységek vezérlése
- a változók mérési szintje vagy szerepe figyelembevételének lehetőségei
- függvénykészletek kihasználása

A téma bárki számára érdekes lehet, még ha egyik eszközt sem ismeri, de a szereplő példák kipróbálása mindkét eszköz alapismeretét igényli.

R alapú automatizálás a Modelerben

A workshop nehézsége: haladó

Előfeltétel: SPSS Modeler ismerete

A Modeler 16-os verziójának megjelenése óta lehetőség van az R open source statisztikai és adatbányászati eszköz által készített kódok Modeler-beli integrációjára. Az R programozási nyelv segítségével olyan új funkciókkal bővíthető a Modeler meglévő analitikai eszköztára, melyek korábban nem álltak rendelkezésre a Modeler felhasználók számára. Az R scriptek node-ok formájában beépíthetők és az alapértelmezett Modeler node-okhoz hasonlóan grafikus felületen szabadon paraméterezhetők.

A workshopon résztvevők megismerkedhetnek az R node-ok használatával, az R nyújtotta lehetőségekkel az adattranszformáció, a modellezés, illetve az adatvizualizáció területén.