Hírek

Milyen a Citizen Data Scientist? Megváltoztatja-e a folyamatokat?

Rendezvény
2019.10.02. 10:39

Folytatódott a Clementine meetup sorozata, melynek első őszi témáját a Citizen Data Scientist jelenség adta.

A szeptember 24-én, a Kubik Coworking Irodában megtartott eseményt Körmendi György, a Clementine ügyvezetője nyitotta meg. A jelenlévők rögtön megtudhatták, hogy a Citizen Data Scientist feladata az adatok elemzése, valamint a kapcsolódó elemző eszközök és modellek működtetése, ugyanakkor nem kell feltétlenül a matematikai statisztika, az adattudomány vagy üzleti intelligencia szakértőinek lenniük. Citizen Data Scientist tulajdonképpen abból a munkavállalóból válik, aki ismerik a big data elemzésekhez szükséges eljárásokat, szoftvereket és azokat üzleti tudással kiegészítve a vállalat fejlesztésére alkalmas tudást hoz létre.

Második előadóként Hámornik Balázs – PhD, BME – is hangsúlyozta az üzleti hozzáértés és iparági szakterület specifikus tudás fontosságát a Citizen Data Scientistek szempontjából. Emellett bemutatta, hogy melyek azok az elemző programok, amelyeket legnagyobb hatékonysággal használhatnak a Citizen Data Scientistek. A bemutatottprogramok közül kiemelte az IBM szoftvercsalád tagjait, amelyek grafikus, felhasználóbarát felületei akár programozási ismeretek nélkül is könnyen használhatóak.

Ezt követően Novák Márton mutatta be az IBM egyik legmodernebb elemző rendszerét a Watson Studiot.

A meetupot a Könyves Tóth Előd által felvezetett kötetlen beszélgetés zárta, ahol a jelenlévők megvitatták nézeteiket a Citizen Data Scientistekről.


Vigyázat! Jönnek a polgári adattudósok!

...avagy Könyves Tóth Előd reagálása a Citizen Data Scientist-ek korát firtató meetup előadások kapcsán:

Veszélyes lehet-e a CDS-ek (Citizen Data Scientist), illetve a nem hagyományos elméleti és statisztikai képzésben részesült, mégis praktikusan prediktív statisztikai szoftvert használók felbukkanása?
Elsőre legtöbbeknek a statisztika klasszikus buktató jelenségei jutnak eszükbe, mint például az álkorrelációk, ritka véletlenek, optikai csalódásokhoz hasonlítható statisztikai félreértelmezési lehetőségek, a szignifikancia és a szubsztanciális jelenségek összekeverése vagy jogtalan statisztikák alkalmazása. Másrészt manapság fókuszban van a szignifikancia fogalom válsága, aminek oka nem feltétlen a dilattantizmus, hanem esetleg a publikációs kényszer, illetve a tudományos teljesítmény mérésénél alkalmazott impakt faktor metrikák, ami miatt a kutatók hajlamosok a szignifikancia vadászatra vagy a p-haching-re.
Számtalan történet tanúsítja, hogy ezek a veszélyek ugyanúgy leselkednek a képzett tudósokra, akár a matematikusokra is. Gondoljunk csak a következő hírhedt ügyekre: Paul Kammerer koincidencia gyűjteménye, Simpson paradoxon, Marilyn vos Savant esete a matematikusokkal a Monty Hall probléma kapcsán, Sir Cyril Burt csalása az intelligencia öröklődésével kapcsolatban, Wansink dosszié a profi p-hacking technikát módszeresen alkalmazó kutatásokról táplálkozási szokásokkal kapcsolatban, stb. Bőséges szakirodalom áll rendelkezésre ebben a témában, például „A tojást rakó kutya” című könyv.
Mégis, akkor miben bízhatunk. Talán a magasabb szintű programnyelvek értelmében magasabb szintű statisztikai szoftverek fejlesztése és alkalmazása, újfajta didaktika kidolgozásával lehetővé teheti a statisztikai műveletek praktikus alkalmazásának oktatását nem matematikusok számára is.
Egy meetup résztvevő kérdése volt, vajon egy hasonló praktikus értelemben tanult orvos vagy egy hagyományosan képzett orvosra bíznánk-e elvégezni magunkon egy súlyos orvosi műtétet. A kérdésre kérdés: tapasztalt sofőrrel vagy autószerelővel fuvaroztatnánk magunkat veszélyes utakon, vagy – kinek a koncertjére mennénk szívesebben: Antonio Stradivari vagy Yehudi Menuhin? Az én szavazatom – stradivari hegedűn játszó Yehudi Menuhin (ha még élne).

Tovább olvasom »

Tovább olvasom »

Tovább olvasom »

Tovább olvasom »