sajtó csomag
SAJTÓKAPCSOLAT
Tel: +36 1 457 0561
Fax: +36 1 457 0562
Cím: 1115 Budapest,
Bartók Béla út 105-113.
Ügynök a böngészőben
Ügynök a böngészőben
A webböngészés évtizedekig egy alapvetően passzív tevékenység volt: kattintottunk, gépeltünk, navigáltunk, és vártuk, hogy a böngésző végrehajtsa a viszonylag egyszerű, egyértelmű utasításainkat. Ez a korszak azonban a végéhez közeledik. Az ügynöki (agentic) böngészők megjelenésével ugyanis a böngésző intelligens partnerré válik, amely nemcsak megjeleníti a tartalmat, hanem a felhasználó nevében gondolkodik és cselekszik is.
Legalábbis, ez az ígérete.

Mi tesz egy böngészőt „ügynökivé”?
Az ügynöki böngészők alapvetően különböznek hagyományos társaiktól. Míg a Chrome vagy Firefox (Safari / Opera) arra vár, hogy rákattintsunk egy linkre, lehívjunk a menüből egy almenüt, addig az ügynöki böngésző magas szintű, összetettebb parancsot is képes értelmezni, például ezt: „foglalj asztalt két főre egy budapesti olasz étteremben péntek estére”, majd autonóm módon végrehajtani. A böngésző (természetesen!) mesterséges intelligencia alapú ügynököket használ, amelyek képesek navigálni a weboldalakon, interakcióba lépni webes elemekkel, és komplex, többlépéses feladatokat elvégezni emberi beavatkozás nélkül. Egyfajta személyi asszisztenssé válnak a böngészők, ha a mostani trendek folytatódnak.
Elindult a verseny
A jelenlegi ügynöki böngésző ökoszisztéma három meghatározó szereplő körül kristályosodik ki, mindegyik saját megközelítéssel.
A Google keresési tortájába harapó Perplexity Comet a tudásmunkások és „power user”-ek számára készült. A böngésző mélyen integrálódik a felhasználó személyes digitális ökoszisztémájával, beleértve a Gmail-t és a Google Calendart. A Comet Assistant képes komplex feladatok autonóm végrehajtására, termékek összehasonlítására és megvásárlására, utazások megtervezésére. Jelenleg e sorok írója 2025 júliusa óta a Perplexity várólistáján csücsül, várva arra, hogy megérkezzen a Comet-meghívója. Ha lenne rá havi 200 amerikai dollárja, akár már most a sor élére kerülhetne – a Perplexity Max csomagjára előfizetőknek ugyanis azonnal letölthető az új játékszer.
A The Browser Company Dia-ja a kreatív szakembereket és dizájnra érzékeny felhasználókat helyezi középpontba. Legkiemelkedőbb funkciója a „Skills” rendszer, amely lehetővé teszi a felhasználók számára, hogy kódolási ismeretek nélkül hozzanak létre MI alapú automatizációs parancsikonokat. A freemium modell (ingyenes, valamint 20 dollár/hó Pro csomag) szélesebb felhasználói bázist céloz, jelenleg kizárólag macOS platformon elérhető.
A kínai fejlesztésű Fellou AI egyedi pozíciót foglal el a RAG (Retrieval-Augmented Generation) technológia alkalmazásával, amely drasztikusan csökkenti a ténybeli hibák esélyét. A „Deep Action” funkció lehetővé teszi, hogy az ügynökök a háttérben hajtsanak végre komplex munkafolyamatokat, akár bejelentkezést igénylő weboldalakon is. A rugalmas árazási modell (19 dollár/hó-tól) a legszélesebb felhasználói bázist célozza. A nyugati felhasználók körében viszont éles viták vannak a Fellou biztonságáról és a fejlesztő cég átláthatóságáról. A szoftver ugyanis mély hozzáférést kér a felhasználó böngészési adataihoz és az operációs rendszer API-jaihoz. Egy zárt forráskódú, független auditokkal nem rendelkező szoftver esetében ez komoly biztonsági kockázatot jelenthet.
Az OpenAI stratégiai lépése
Az iparág legnagyobb súlyú szereplője, az OpenAI sem marad ki a versenyből. A hírek szerint a vállalat egy Chromium-alapú webböngészőn dolgozik, amely a ChatGPT-t és egy „Operator” nevű MI-ügynököt integrálna a böngészés alapvető élményébe. A koncepció radikális: a lapfülekkel operáló interfész lecserélése egy csevegés alapú, párbeszéd-vezérelt felületre.
Az OpenAI 2025 júliusában hivatalosan bejelentette a „ChatGPT agent”-et, amely a jövőbeli böngésző motorját képezi. Ez az ügynök sokoldalú eszköztárral rendelkezik: vizuális és szöveges böngészővel, beépített terminállal, valamint közvetlen API-hozzáféréssel. A legújabb GPT-5 modell jelentős fejlődést mutat az „instruction following” és az ügynöki eszközhasználat képességekben.
A Birodalom visszavágása, sokadik rész
A Google, amely a generatív MI szinte minden területén az élre tört (LLM: Gemini Pro 2.5, kép: Imagen 4, film: Veo 3, kódolás: Firebase és Jules stb.), maga is dolgozik egy Mariner nevű ügynöki böngészőn.
A horizontális MI-versenyzők
Érdemes még megemlíteni a főleg kínai elmékből származó, nagyon ötletes (és pocsék ügyfélszolgálattal rendelkező) általános MI ügynöki eszközöket. Ezek jó példája a Manus AI és a Genspark, amelyek maguk is belépnek a böngészőpiacra, tovább fokozva a versenyt.
Az intelligens döntéshozatal mechanizmusa
Az ügynöki böngészők működésének alapja a ReAct (Reasoning and Acting) keretrendszer, egy folyamatos, iteratív ciklus. Ez három fázisból áll:
• észlelés, amikor az ügynök felméri a weboldal állapotát,
• gondolkodás, ahol logikai következtetéseket von le és akciótervet készít,
• cselekvés, amikor végrehajtja a meghatározott műveletet.
A ciklus addig ismétlődik, amíg az ügynök el nem éri a kitűzött célt.
A paradigmaváltás társadalmi hatásai
Az ügynöki böngészők elterjedése alapjaiban változtathatja meg a digitális gazdaságot. A hagyományos, kulcsszó-alapú SEO elveszíti központi jelentőségét, helyette a strukturált adatok válnak fontossá. A „zero-click” (kattintás nélküli választ adó) keresések elterjedése súlyos kihívást jelent a piaci szereplők számára, akik új üzleti modelleket kényszerülnek keresni.
A felhasználók számára az előnyök egyértelműek: drasztikus produktivitásnövekedés, kognitív terheléscsökkenése és hiperperszonalizált webélmény. Ugyanakkor komoly kockázatokat is rejt a technológia. Az új „Scamlexity” jelenség keretében a kiberbűnözők már az MI-ügynökök döntéshozatali logikájának manipulálására összpontosítanak. A promptinjektálás, a vizuális megtévesztés és az adatszivárgás új típusú támadási irányokat jelez.
Egy új digitális kor küszöbén
Az ügynöki böngészők nem csupán új eszközök, hanem az ember-gép interakció következő fejezetének hírnökei. A web használata átalakul: a passzív böngészésből aktív delegálás lesz. Ez óriási potenciált rejt az emberi produktivitás felszabadítására, de egyben a befolyásolás is új fegyvert kaphat.
Szubjektív vélemény
E cikk írója maga is hozzáférést kapott a Fellou AI böngészőjéhez. Az élmény felemás, de még inkább: egyelőre nem meggyőző. A Fellou ugyanis látványos abban, ahogy helyettünk oldalakat nyit meg, klikkelget, de a problémák még nagyon is szembetűnőek:
• az emberhez képest sokkal lassúbb (weboldal értelmezésében például),
• sokszor – akárcsak a genAI-eszközök – rosszul válaszol,
• a Fellou kreditekkel működik. Ez azt jelenti, hogy egy rosszul elvégzett feladat végső soron pénzbe kerül nekünk. Tehát kapunk egy olyan munkatársat, aki lelkes ugyan, de akkor is ki kell fizetnünk, ha mellélő a tőlünk kapott feladat teljesítésében.
A saját kísérletem végén arra jutottam: egyelőre nincsen olyan sürgető use case, amely miatt a jó öreg Chrome-ról és Firefoxról lemondanék. Még akkor sem, ha látom, hogy a technológia fejlődésével sokkal jobb felhasználói élmény vár majd rám.
Ám egyelőre még nem tartunk ott.
-
Okos és szórakoztató, avagy mesterséges intelligencia a CES-en
-
Barátod, az MI, nem a barátod