Skip to main content

Vélemény

sajtó csomag

Töltse le a Clementine bemutatkozó anyagát.

SAJTÓKAPCSOLAT

E-mail: Ez az e-mail-cím a szpemrobotok elleni védelem alatt áll. Megtekintéséhez engedélyeznie kell a JavaScript használatát.
Tel: +36 1 457 0561
Fax: +36 1 457 0562
Cím: 1115 Budapest,
Bartók Béla út 105-113.

Együtt, működünk: ember-LLM kollaboráció az adatelemzési folyamatokban

Együtt, működünk: ember-LLM kollaboráció az adatelemzési folyamatokban

2025. április 07.

Az adattudósok és a nagy nyelvi modellek együttműködése nem csupán munkafolyamat, hanem teljesen új gondolkodásmód, amely átírhatja a szakma szabálykönyvét. Az igazi áttörés a minőségileg új elemzésekben és értelmezésekben mutatkozik meg. Ma már nem az a kérdés, hogy ember vagy AI, hanem az ember és AI kollaborációjának minősége.

Az alábbi cikk a 2025. május 20-i, dataSTREAM 2025 – Adattudósok az LLM-korszakban című konferenciánk beharangozójaként készült.

Az adatelemzés új dinamikája

A programozó-szoftverfejlesztők egy ideje küzdenek egy sajátos ellentmondással: miközben örömmel automatizálják a repetatív feladatokat, közülük sokan attól tartanak, hogy ezzel munkakörük, így végső soron saját állásuk felszámolásához járulnak hozzá. Természetesen az LLM-ek megjelenése, és az olyan egyre népszerűbb kódolási eszközök, mint például a Cursor vagy a Windsurf használata erősítette fel ezeket a félelmeket. A valóság szerencsére sokkal izgalmasabb – és barátságosabb – annál, mint hogy egyszerűen "emberek kontra mesterséges intelligencia" narratívában gondolkodjunk. A tapasztalatok szerint a generatív AI-eszközök egyelőre teljesítménynövelő „boost"-okként működnek, vagyis aki jól ért az adattudományhoz, az a szakember még jobban ki tudja aknázni a generatív mesterséges intelligenciában rejlő előnyöket.

Figyelemreméltó tény, hogy például a McKinsey AI-ról szóló általános jelentése is a GenAI-eszközök megnövekedett használatáról számol be a szervezeteknél (a 2023-as 55% tavaly már 71%-ot mutatott, azaz a szervezetek közül ennyi volt, amely legalább egy üzleti funkcióban AI-t vett igénybe). Az Arize cég iparági felmérése szerint hasonló folyamat játszódik le az adattudósok körében is: a kipróbálástól, kísérletezéstől haladunk a munkafolyamatokba való beépülés, a mélyebb adaptáció irányába. Az ember és AI kollaborációja tehát az adattudományban is elkezdődött.

Egy felmérés szerint az adattudósok 63%-a már rendszeresen használ LLM-eket az elemzési munkafolyamatokban, ami jól mutatja ezeknek az eszközöknek a növekvő elfogadottságát a szakmában. Emellett a visszajelzések azt mutatják, hogy az adattudósok nagy része (90%) indokoltnak tartja a generatív AI körüli felhajtást, és több mint a felük (55%) úgy véli, hogy ez jelentős hatással lesz a vállalkozásukra a következő egy-két évben.

A hogyan és mit kérdése

A legáltalánosabb, leginkább magától értetődő LLM-használat adattudósok részére:

Az LLM mint adatfeltáró: „mutasd meg, amit én nem veszek észre!" modell, ahol az adattudós irányításával az LLM alternatív mintázatokat keres az adatokban.

Az LLM mint kódíró partner: "te írd meg, én finomhangolom" modell, ahol a modell generálja az alapkódot, amit aztán az adattudós optimalizál.

Az LLM mint értelmező: "segíts kommunikálni!" modell, ahol a technikai eredményeket az LLM üzleti nyelvre ülteti át.

Az LLM-ek ráadásul integrálhatók prediktív AI-megoldásokkal, például a Pecan AI Predictive GenAI-jával, amely természetes nyelvi interfészeket és automatizált kódgenerálást kínál, javítva a felhasználói élményt és hatékonyságot. Ez lehetővé teszi, hogy az adattudósok természetes nyelven adhassanak ki parancsokat, például "Mutasd meg az ügyfélelégedettség trendjeit".

A Stanford HAI és MIT Media Lab közös kutatásai kimutatták, hogy az iteratív promptfejlesztési módszerek 46%-kal pontosabb eredményeket produkálnak, mint az egyirányú utasítások, ami alátámasztja, hogy a jó együttműködés nem monológ, hanem párbeszéd. Emellett a GitHub Copilot, egy LLM alapú kódolási asszisztens bizonyítottan javítja a fejlesztői termelékenységet, csökkenti a kódolási megoldások keresésére fordított időt és felgyorsítja a fejlesztési folyamatot.

Az ideális munkamegosztás: ki miben jó?

A hatékony együttműködés kulcsa a funkcionális munkamegosztás. Az LLM-ek kiváló képességekkel rendelkeznek olyan területeken, mint például a gyors kódgenerálás és hibajavítás, az alternatív elemzési utak szisztematikus feltárása vagy a dokumentáció generálása és a minták felismerése.

Az LLM-ek különösen hasznosak az adatelőkészítés és -tisztítás területén. A McKinsey egy 2024-es riportja szerint a generatív AI akár 80%-kal is csökkentheti az adattudósok adatelőkészítési munkáját.

Az ember eközben megtartja kulcsszerepét, hiszen ő az, aki – valóságértelmezésének köszönhetően – megérti az üzleti probléma mibenlétét, lényegét, azonosítja a kritikus döntési pontokat, validálja az eredményeket, és egyáltalán: ő a szakértő, aki a promptolási folyamat elején, közepén és végén (a kimenetnél) áll.

A leghatékonyabb adattudósok nem azok, akik a legjobban kódolnak, hanem akik a legügyesebben irányítják és értelmezik az LLM-ekkel közös munkafolyamatot. Ezt támasztja alá ugyancsak a McKinsey Global Institute friss elemzése is, amely szerint az adattudósok munkaidejének átrendeződése radikális: a kódolással töltött idő 37%-kal, az adattisztítási feladatokra fordított idő pedig 42%-kal csökkent, miközben az elemzési stratégiák kidolgozására fordított idő 64%-kal, az üzleti értelmezésre szánt idő pedig 51%-kal nőtt.

Néhány tipp a hatékony együttműködéshez

1. Tekints az LLM-re úgy, mint egy junior kollégára, aki gyors, de irányításra, gyakran korrekcióra szorul. Aki lelkes, sohasem sértődik meg, és számtalanszor felkérhető ugyanannak a feladatnak a finomítására, csiszolására.

2. Alkalmazz iteratív prompt stratégiákat! Ilyen a "chain-of-thought" módszer, ahol lépésről lépésre vezeted az LLM gondolkodását, és ez pontosabb elemzéseket eredményez. A Datacamp kutatásai szerint ez a megközelítés 28%-kal pontosabb elemzésekhez vezet.

3. Tartsd fenn a kritikus szemléletet! Minden LLM-eredmény validálást igényel.

4. Dokumentáld az együttműködést! Egy cégen belül rendkívül fontos, hogy a legjobb promptok és munkafolyamatok ne vesszenek feledésbe, hanem mások is profitálhassanak a már megszerzett tudásból. A Bloomberg jelentése szerint a pénzügyi szektorban a regulátorok már explicit módon kérik az LLM-közreműködés dokumentálását az elemzésekben.

Az augmentált adattudós kora

Az ember-LLM együttműködés nem a helyettesítés, hanem a kiegészítés, az ember képességeinek kiterjesztése felé mutat. Ebben az augmentációs folyamatban az adattudósok szerepe nem csökken, hanem átalakul: a kódolási részletekről a stratégiai irányítás és értelmezés felé mozdul, a repetatív munkától a gondolkodósabb feladatokig.

Az együttműködés trendjét erősíti meg az Arize felmérése is, amely szerint az AI-csapatok több mint fele (57,7%) tervezi egy kisméretű nyelvi modell éles környezetben történő bevezetését a következő 12 hónapban, vagy amilyen gyorsan csak lehetséges. Ez a tendencia azt mutatja, hogy az LLM-ek és a generatív AI nem csupán kísérleti projektek maradnak, hanem egyre inkább a mindennapi munkafolyamatok részévé válnak.

Ha eljön a 2025. május 20-i konferenciánkra, még több érdekes információt osztunk meg az LLM és az adattudomány kapcsolatáról.