Skip to main content

Vélemény

sajtó csomag

Töltse le a Clementine bemutatkozó anyagát.

SAJTÓKAPCSOLAT

E-mail: Ez az e-mail-cím a szpemrobotok elleni védelem alatt áll. Megtekintéséhez engedélyeznie kell a JavaScript használatát.
Tel: +36 1 457 0561
Fax: +36 1 457 0562
Cím: 1115 Budapest,
Bartók Béla út 105-113.

Lecsap a Llama: a nyílt forráskódú MI-modellek térhódítása

Lecsap a Llama: a nyílt forráskódú MI-modellek térhódítása

2024. május 27.

ChatGPT, Claude, Gemini– ezek már minden, mesterséges intelligencia iránt fogékony háztartásban (cégben) ismerős nevek. Az úgynevezett nagy nyelvi modellek mellett azonban szinte mozgalomszerűen megjelentek a nyílt forráskódú rendszerek, amelyek helyet követelnek maguknak a Nap alatt. A cikkben röviden összefoglaljuk, hogy miért.

Okosak és sokba kerülnek

A ChatGPT jött, látott és győzött. A mai napig legismertebb – és számos benchmarkban legjobban teljesítő – chatbot e cikk írása előtt mutatta be O(mni) kódnevű változatát, amely újabb varázslatos képességekről tett tanúbizonyságot a céges demókban. Természetesen a Birodalom is visszavágott: az Alphabet Geminije pár nappal később látványos prezentációban indokolta meg, hogy a keresőóriás anyavállalata komolyan gondolja a piaci harcot. Kettejük küzdelme mellett ott van még (nevető) harmadikként az Anthropic cég Claude modellje, amelyet sokan az egyik legintelligensebb, hosszabb szövegek létrehozására legalkalmasabb versenyzőnek tartanak.

A gond azonban az, hogy ezek egyrészt nagyon drága, erőforrás- és energiaigényes eszközök (a Stanford számítása szerint csak a Gemini Ultra betanítása 190 millió dollárba került). Ezen kívül a cégek hogyan tudnák a legjobban kiaknázni a saját adatkészletükben rejlő potenciált, ha egy másik vállalat a szolgáltatójuk?

Itt lépnek a képbe a nyílt forráskódú nagy nyelvi rendszerek.

Nyílt: kisebb és kompaktabb

A „nyílt” ebben az esetben a kódra, az adatstruktúrára és a kiképzésükre vonatkozik: ellentétben például a ChatGPT-vel, előbbiek esetében pontosan tudjuk, hogyan történt a betanítás. Így könnyen „beleláthatnak” a kutatók, és továbbfejleszthetik a rendszereket, miközben az adatlopás gyanúja fel sem merül. (Az informatikában egyébként régi jelenség a nyílt fejlesztés, ennek gyümölcsét mindenki élvezheti, aki például a Firefoxot, a közösség által egyre jobbá tett böngészőt használja.)

Tegyük fel, hogy egy cég saját, intelligens chatbotot szeretne fejleszteni! Választhatja a ChatGPT API-ját, hogy ahhoz kapcsolódva hozzon létre egy újat magának, de ebben az esetben két területen is problémába ütközik. Először is, korlátozott a testre szabási lehetősége, másodszor pedig továbbra sem tudja, milyen adatkészleten okosították fel az algoritmust. Egy nyílt forráskódú nagy nyelvi rendszernél mindezek a kifogások eltűnnek. Emellett azonban nem elhanyagolható az adatbiztonság kérdése sem, hiszen a más cég felhőjének használata biztonsági okokból nem minden cég, nem minden munkafolyamatában megengedett, míg a nyílt változatnál – épp a testre szabhatóság miatt – ez könnyebben megoldható.

A nyílt rendszerek cégen belüli „megépítése” egyszerűbb és olcsóbb mutatvány, mintha valamelyik techóriás fizetős változatát választanák. Ha ezt összekötik a RAG-technológiával (Retrieval Augmented Generation), akkor a cég védett, naprakész adataival történik a betanítás, és ez még pontosabb működést eredményez. Gondoljuk el, hogy ez a tény milyen előnyt jelent például egy saját, ügyfélszolgálati MI-rendszert fejlesztő vállalat esetében!

A további nyilvánvaló és érzékelhető előny, hogy sokkal kisebb, ezáltal gyorsabb, specifikusabb és fenntarthatóbb modellek jönnek létre, sőt, a működtetésükhöz is kevesebb szakember kell, mint a nagy testvéreikhez.

A Meta válasza a Microsoftnak és az Alphabetnek

A betanítható adatok kincsestárán csücsülő Meta (leánykori neve: Facebook) maga is a nyílt – és természetesen a közösségi hálózataiba beépíthető – nyelvi rendszer mellett tette le a voksát. A Llama-sorozat harmadik változatát 2024 áprilisában publikálták, és az elemzőket lenyűgözte a modell teljesítménye. A 15 trillió (!) tokenen betanított Meta-termék képességei sok esetben alig maradnak el a legújabb ChatGPT-től (természetesen számít, hogy milyen feladatra használják).

A Llama mellett megjegyzendő további nevek az IBM Granite-ja, a Microsoft saját Phi-3-ja, de mi különösen örülhetünk a Mixtral 8x7B-nek – ez utóbbiban végre egy európai nyílt nyelvi rendszert üdvözölhetünk. A francia cég terméke jelenleg szinte a legjobb ár-érték arányt kínálja, és további olajat locsol a nyílt nagy nyelvi rendszerek egyre magasabbra csapó lángjaira. A szinte mozgalomszerű lelkesedés érthető: az OpenAI, amely a nevével ellentétben nagyon is zárt, egyre jobb versenytársakat kap, így végső soron mi, a fogyasztók csak nyerünk a helyzeten.

Végül meg kell említenünk, hogy már most látszik egy mindenki számára érthető használati mód: kis méretüknél fogva a nyílt rendszerek némelyike akár egy saját laptopon, sőt mobiltelefonon, internetkapcsolat és felhő nélkül is futtatható. Ezzel a generatív mesterséges intelligencia még közelebb került ahhoz, hogy olyan mindennapi informatikai eszközzé váljon, mint például a levelezőprogram vagy egy Word.