Skip to main content

Színes

sajtó csomag

Töltse le a Clementine bemutatkozó anyagát.

SAJTÓKAPCSOLAT

E-mail: Ez az e-mail-cím a szpemrobotok elleni védelem alatt áll. Megtekintéséhez engedélyeznie kell a JavaScript használatát.
Tel: +36 1 457 0561
Fax: +36 1 457 0562
Cím: 1115 Budapest,
Bartók Béla út 105-113.

A mesterséges intelligencia már nem a jövő zenéje, avagy japán popsztártól a generatív megoldásokig

A mesterséges intelligencia már nem a jövő zenéje, avagy japán popsztártól a generatív megoldásokig

2024. március 11.

A zene szinte magától értetődően az a terület, amely jó alapanyaga lehet a mesterséges intelligenciának, a mélytanulási rendszereknek: egyértelmű mintázattal rendelkezik, amelyet könnyen át lehet fordítani matematikai és statisztikai nyelvre. Mégis, a kezdeti lépések után itt is a generatív MI berobbanása kellett, hogy a zenészek is beállhassanak az „MI elveszi a munkánkat” egyre népesebb, és sajnos egyre realistábbnak tűnő kórusába.

A test nélküli J-Pop

2004 elején, egy közös kutatási projekt eredményeképp adta ki a Yamaha Corporation a Vocaloid nevű szoftvert. A zenei program előre szintetizált emberi énekhangok manipulációját tette lehetővé. A történet itt azonban nem ért véget: bárki beírhatott dalszöveget is, amelyet a Vocaloid elénekelt (ma már angol, japán és koreai nyelven is). Így egyszerűbb a sztárcsinálás, gondolták a sapporói Crypton Future Mediánál, akik 2007-ben a technológiára „ráültették” Hatsune Mikut, aki új virtuális énekesként lépett elő. A speciális vetítéssel koncerteket adó figura a leírások szerint egy 16 éves, 158 centiméteres, 48 kilogramm tömegű lány, akinek még a hangterjedelmét is meghatározták. Hatsune Miku azóta gyakorlatilag a japán popkultúra jeles képviselőjeként még olyan rangos, külföldi eseményeken is „fellépett”, mint például a legendás Coachella fesztivál. (Érdemes szétnézni a virtuális lény / lány YouTube-csatornáján.)

Gép + ember a Beatles stílusában

2016-ban a Sony CSL Research Laboratory kutatói lepték meg a világot az első, MI által (is) létrehozott popdallal. A Flow Machines algoritmust popdalok tízezreivel „etették”, így a rendszer mélytanulással feltérképezte az egyes zenei előadókra jellemző stílust, tempót, váltásokat, dallamokat és ritmusokat. Ebből választották ki a Beatles stílusát, és a Flow Machine egy új dallamot generált. 2016-ban azonban még nem tartottunk ott, ahol ma, így francia zeneszerzők, Benoit Carré és François Pachet alakították véglegesre a dalt, és a szöveget is ők írták a keresztségben Daddy’s Car címet kapó dalhoz.

Azóta egy 15 nagyon különböző stílusú dalt tartalmazó, Hello World című albumot is kiadtak a Flow Machine projektfelelősei, méghozzá a SKYGGE nevű művész bábáskodásával (tehát még nem teljesen automatizálták az alkotási folyamatot). Az album itt meghallgatható.

Sláger, ami sose volt

2023 szeptemberében érkezett a meglepő hír: Grammy-díjra szeretnék jelölni a Drake és a Weeknd művésznevű énekesek kollaborációját, a Heart on My Sleeve című dalt. A gond csak az volt, hogy a popszámhoz az említett két előadónak semmi köze nem volt – annál inkább a generatív MI-t használó, titokzatos, Ghostwriter fedőnevű alkotónak. A technológiai kérdés mellett itt már előjön egy mélyen emberi kérdés: vajon ki az alkotója az ilyen daloknak? Az egyik ottani szakmai szervezet szerint kétségkívül egy ember (a szövegét mindenképp ő írta, a kórusokat pedig az MI hozta össze), tehát a dal jelölhető. (Végül más okok miatt a Grammy nem jöhetett össze).

Nekünk, magyaroknak sincs szégyenkeznivalónk ezen a területen. 2024 januárjában jelent meg a videómegosztókon az AZAHRIAH x SZOBOSZLAI - Azi meg a Szobó (AI VOICES, MIND1 COVER), MI által generáltatott zeneszám. A később magát csak „Frontemberként” aposztrofáló, maszkban és eltorzított hangon nyilatkozó anonim készítő elmondta, hogy ezen a dalon kívül „igyekszünk majd olyan embereket mikrofon elé állítani virtuálisan, akik a való életben valószínűleg nem fognak rappelni vagy énekelni.” A hírek szerint a jelenlegi legnépszerűbb magyar dalszerző, előadó, Azahriah nem rajong a nevét (és hangját) felhasználó, mára már a kétmillió megtekintést is átlépő álszerzeményhez.

Jönnek a zeneszerző alkalmazások!

A jövő pedig elkerülhetetlennek tűnik ezen a területen. A nagyok, így a Meta vagy a Google már bemutatták a maguk zeneszerző mesterséges intelligenciáit, amelyek nagyon ígéretesnek tűnnek már most is. A promptból dalt szerző gépi megoldások némelyikét már a piac teszteli. Ilyen a Casette AI is, amely már több mint 50 000 aktív felhasználóval büszkélkedhet, de korlátai még egyértelműek. A freemium modellben elérhető alkalmazás ugyanis képes nagyon inspiratív, továbbgondolásra érdemes zenéket szerezni a legváltozatosabb stílusokban és műfajokban, de az ember által szerzett (könnyű)zene finomságaihoz még mindig emberi kéz kell. Pont az történik tehát, amit a szöveggenerálásnál is egy író vagy marketinges is megtapasztal.

Ez a helyzet azonban csak a jelenre, 2024 első negyedévére igaz – milyen eszközeink lesznek majd vajon egy vagy két év múlva? Talán annál is jobb, amellyel életre keltettek 2023 végén egy 1966 óta szunnyadó Beatles-dalt, a mélytanuló rendszernek köszönhetően először hallható Now and Then-t?

Az igazán disztópikus borzongásra vágyóknak végezetül a teljes egészében, tehát zene, szöveg és előadó, valamint klip tekintetében is mesterséges klipet ajánljuk a beszédes nevű Anna Indiana (AI) nevű „előadótól”.