sajtó csomag

Töltse le a Clementine bemutatkozó anyagát.

Letöltés

SAJTÓKAPCSOLAT

E-mail: Ez az e-mail-cím a szpemrobotok elleni védelem alatt áll. Megtekintéséhez engedélyeznie kell a JavaScript használatát.
Tel: +36 1 457 0561
Fax: +36 1 457 0562
Cím: 1115 Budapest,
Bartók Béla út 105-113.

Élet az OpenAI-n kívül

Vélemény

2023. december 19.

Világszerte ömlik a pénz a generatív mesterséges intelligenciát kínáló, fejlesztő vállalkozásokba. Természetesen a ChatGPT forradalma tette lehetővé, hogy csak idén, alig háromnegyed év alatt új unikornisokat üdvözölhessünk a színtéren. Ezek az egymilliárd dollárnyi céges értéket elérő vállalatok és vállalkozások megmutatják, hogy bár az OpenAI még mindig a legfontosabb szereplő, a generatív MI-ben már sorakoznak a tőkével jól ellátott trónkövetelők. Cikkünkben a teljesség igénye nélkül mutatunk be párat ezek közül.

Born In The USA

Az első és legfontosabb megállapítás, hogy a legtöbb, igazi potenciállal rendelkező, generatív mesterséges intelligencián dolgozó cég az Egyesült Államokban található. Vannak ugyan nem amerikaiak is (ezekből is szemezgetünk ebben az írásban), de a befektetői pénz alapvetően az USA-n belül áramlik.

Érdekes, hogy Kína válasza a ChatGPT-re a 2023 márciusában bemutatott Ernie (Enhanced Representation through Knowledge Integration) bot,a Baidu óriásvállalat által elkészített chatbot – nyugati társaihoz hasonlóan – beépített „cenzúrával” rendelkezik. Amíg az USA-ban ez az identitás, politika és kisebbségi kérdések körül forog, addig Kínában pártpolitikailag korrekt, nem lehet megkérdezni Ernie-t például a kínai elnökről vagy az 1989-es Tienanmen téri vérengzésről. Októberben jelentették be az Ernie 4.0-t, amelyet a ChatGPT-4 riválisának szánnak: ezt egy élőben írt harcművészeti regény, valamint reklámposzterek létrehozásával demonstrálták. A verseny erősödését jól jelzi a tény, hogy Kínából származik a nagy nyelvi modellek 40%-a, és ez alig marad el az USA 50%-ától.

Az országokat tekintve kétszereplős modellbe beleszólást kér a sok szempontból már régóta a jövő felé kacsingató Egyesült Arab Emirátus. Az öbölmenti olajhatalom ugyanis 2023-ban mutatta be a Falcon 40B-t, amelyet az egyik legerősebb nyílt nagy nyelvi rendszernek tartottak a szakértők, szeptemberben pedig az elképesztő gyorsaságúnak titulált újabb modellt, a 3,5 trillió (!) tokenen betanított Falcon 180B-t. A királyság azt reméli, hogy dedikált figyelme és erőforrásai miatt a Falcon 180B a régióban elterjed, és meghatározó szerepe lesz majd az orvoslásban vagy a biotechnológiában éppúgy, mint például a pénzügyek területén.

Nagyban játszanak

A ChatGPT egyik nehézsúlyú konkurense az Anthropic cég. Létrejötte úgyszólván belsős munka, hiszen az OpenAI néhány korábbi, magas beosztású munkatársai, többek közt a kutatási igazgató alapította. Legfontosabb produktumuk a Claude nevű chatbot, amelynek idén novemberben bemutatott 2.1-es változata már bemenetként akár egy 500 oldalas angol nyelvű könyvet is képes kezelni, vagyis a kontextusablaka minden eddiginél – és riválisainál is – nagyobbra nyílt. A ChatGPT jobb az általános, nyitott végű csevegésekben, míg a szakértők a Claude precízebb technikai válaszait dicsérik, és kiemelik a hosszú formátumú elemzésekben való ügyességét.

A San Franciscó-i Anthropic fő befektetői közé tartozik az Amazon és a Google is.

Hollywood végveszélyben?

A text-to-video terület egyik nagyágyúja a New York-i Runway. Nem is mérete, hanem szolgáltatása miatt számít annak: a szöveg alapján filmet generáló terméke ugyanis az egyik legelképesztőbb minőséget produkálja. A TIME magazin az év 100 legbefolyásosabb vállalata közé választotta a művészek által alapított céget, amely forradalmasítani, vagyis demokratizálni, olcsóbá és elérhetőbbé kívánja tenni a filmkészítést. Többféle kreatív eszközt gyárt, amelyek könnyebbé teszik akár a vágást és a változtatásokat is.

A nemrég meghirdetett saját filmes pályázata, a beküldött munkák minősége bebizonyította, hogy felmérhetetlen potenciál rejlik ebben a területben, vagyis tulajdonképpen a Runway munkájában.

Szövegben erős

Az izraeli, az idén unikornissá változott cégek listáján előkelő helyen szereplő AI21 nem most kezdte az ipart: már 2017-ben kijöttek az írást segítő asszisztensükkel, a Wordtune-nal. A tel-avivi székhelyű vállalat azóta új termékekkel rukkolt elő, például a Wordtune Spice-szal, amely azt ígéri, hogy automatikus szövegkiegészítése segítségével gyorsabbá teszi magát az írást is. Sokan a ChatGPT riválisát látják e termékük tudásában. Így nem csoda, hogy a befektetők közt olyan neveket találunk, mint az Nvidia vagy a Google.

A kód neve: Replit

A 2016-ban alapított, San Francisco székhelyű Replit a programozók aranybányája – legalábbis mesterséges intelligencia szempontból. Az OpenAI API-ját használó szoftver ugyanis MI alapú eszközökkel segíti a kódgenerálást, a programozást. A Replit képes automatikusan kódot létrehozni a felhasználó által, természetes nyelven bevitt prompt alapján, illetve képes felismerni a hibákat és azokat kijavítani. Nem utolsósorban lehetőség van a kódok stílusának formázására is. A böngészőből irányítható, online integrált fejlesztői környezet nagy népszerűségre tett szert a programozók közt, ezt bizonyítja a rengeteg példa, amellyel ezzel kapcsolatban a közösségi médiában (főleg az egykori Twitteren) találkozhatunk.

Az Ön élethű avatárja

Rövid felsorolásunk nem lehet teljes a már egy ideje meglévő, és egyre gyakrabban használt Synthesia nélkül. A 2017-ben alakult brit cég mélytanulási modellre alapozott terméke úgy dolgozik, hogy mintát vesz a felhasználó videójából, a kép és a hang feldolgozása után lehetőséget adva, hogy bármilyen beírt szöveget az avatár elmondja. Prezentációkhoz, tanfolyamokhoz, e-learning anyagokhoz így jól használható ez a megoldás, ráadásul már 60 nyelven. Így például egy magyarul felvett anyagból például angolul is beszélő avatár készíthető.

Visszavág-e a birodalom?

A terület újdonságait követők számára legfontosabb kérdést, hogy mit lép – elsősorban az OpenAI diadalmenetére – a nagy testvér, az Alphabet (Google).

Először a Bard chatbotjuk relatív sikertelensége (tapasztalatok alapján: relatív elmaradottsága) mutatta meg, hogy Alphabet programozói és szakemberei még nem tudták utolérni a ChatGPT-4-et. A titokzatos Gemini-projektnek, amely az új generatív mesterséges intelligenciának szánnak, először eltolták az idénre várt hivatalos bemutatását, majd decemberben mégis bemutatták a Gemini 1.0-át. (A kedélyeket borzolta egy korábbi demóvideó, amely hihetetlen képességeket mutatott a Geminiről, de kiderült, hogy egy erősen megszerkesztett vágatról van szó.)

Mindenesetre a Gemini multimodális, vagyis bemenetként (prompként) képet, szöveget, hangot és videót is elfogad – igaz, a hang- és képelemzési képességeit már csak jövő évre ígérik. A három különböző csomagban és tudással (Ultra, Pro és Nano) kínált nagy nyelvi rendszer igyekszik a rivális hajójából kifogni a szelet. Az előjelek kedvezőnek tűnnek a régi-új trónkövetelő számára: a Google állítja, hogy a benchmark tesztekben produktumuk már most veri a ChatGPT-4-et.

A Bardba beépülő rendszer a Google saját mobiltelefonjába is bekerül, és már az API-jához is hozzáférnek a fejlesztők, újabb frontot nyitva a legfrissebb platformháborúban.