Digitália

2023.01.06. 06:00

Íme, már zenét is készíthetünk mesterséges intelligenciával

Az otthoni számítógéppel is remekül működnek. Nem mindenki örül nekik.

Forrás: Shutterstock

Nem véletlen, hogy cikkünk első bekezdései vastag betűkkel jelennek meg:

A mesterséges intelligencia (AI) döbbenetesen nagy előrelépést tett az elmúlt években, tömegek, milliók kezébe kerül a művészeti alkotások készítésének a lehetősége. Miként a képzőművészeti alkotásban pillanatok alatt elterjedt – milliónyi kép készül naponta nagy művészek alkotásaiból otthoni számítógépeken – a másik terület, amelyre jelentős hatást gyakorol az AI, a zene.

A számítógépes zenét olyan algoritmusok és számítási folyamatok segítségével hozzák létre, amelyek utánozzák az emberi alkotói folyamatot. A technológia forradalmasíthatja zenei alkotásunk és élményünk módját – igaz, egyúttal megkérdőjelezi az egész művészeti folyamatot, hiszen bárki, zeneileg teljesen képzetlenül alkothat.

Ami a művészeket illeti, az AI által generált zene egyik legnagyobb előnye, hogy csökkenti az új zeneművek elkészítéséhez szükséges időt és erőfeszítést. A hagyományos zeneszerzés munkaigényes folyamat, amely hosszan tartó gyakorlást és finomítást igényel. Az AI zeneszerző algoritmusainak segítségével azonban gyorsan generálhatnak a művészek új zenei ötleteket, lehetővé téve számukra, hogy kompozícióik finomítására és tökéletesítésére összpontosítsanak. Ez felgyorsíthatja a kreatív folyamatot és hatékonyabbá teheti azt.

A mesterséges intelligencia által generált zene másik lehetséges előnye, hogy új és egyedi zenei stílusokat és műfajokat hozhat az előtérbe. Mivel az AI-algoritmusok hatalmas mennyiségű adatot képesek feldolgozni és új ötleteket generálni, segíthetnek olyan zenét létrehozni, amely semmihez sem hasonlítható, amit korábban hallottak.

Ez teljesen új zenei műfajok megjelenéséhez vezethet, és kreatív lehetőségeket nyithat meg a művészek előtt.

A mesterséges intelligencia zenei alkalmazása azonban néhány fontos kérdést és aggályt is felvet. Probléma, hogy a generált zene helyettesítheti az emberi zenészeket és zeneszerzőket, ami munkahelyek elvesztéséhez és a zene minőségének romlásához vezethet. Aggodalomra ad okot, hogy a mesterséges intelligencia használata a zenében a zenei stílusok homogenizálódásához, egyszerűsödéséhez vezethet, mivel az algoritmusok nagyobb valószínűséggel generálnak olyan ötleteket, amelyek hasonlítanak a meglévőkre, s nemigen gyártanak eredeti kompozíciókat.

Miért áll csupa vastag betűből a fenti szöveg? Mert így jelöltük meg, hogy ezt a szöveget nem ember, hanem mesterséges intelligencia írta.

A Music Ally ugyanis felkérte a ChatGPT mesterséges intelligenciát használó, bárki által az interneten ingyenesen elérhető chatrobotot, hogy „írjon egy 300 szavas bevezetőt egy mesterséges intelligencia által generált zenéről szóló cikkhez, amelyben leírja annak előnyeit és veszélyeit”, és ezt válaszolta. (Nem a teljes szöveget fordítottuk angolból magyarra.)

Az elmúlt hónapokban művészek és művészetpártolók között heves vitákat váltott ki a széles körben elérhető szöveg-kép AI-k növekvő száma: ezek csupán szöveges definíciók alapján készítenek képeket, festményeket, videókat. A konfliktus alapja leginkább az, hogy kértek-e engedélyt a művészektől (nem), hogy tudásukat átadják a mesterséges intelligenciáknak, illetve, hogy hiányoznak a szükséges engedélyek (hiányoznak), s hogy mi lesz a jogdíjfizetéssel.

És ugyanez a helyzet a zenével. Tavaly már egyes zenei testületek ellenezték, hogy az AI-cégek rendszereiket kreatív alkotásokra, köztük zeneírásra kiképezzék, „az alkotók és a jogtulajdonosok engedélye nélkül”.

Közben a streaming cégek vita helyett inkább elkezdtek fejleszteni. A Spotify például még 2017-ben felkérte az AI-zene egyik ismert szakértőjét, François Pachet, hogy vezesse az AI-laboratóriumukat. A Spotify ki is adott egy nyílt forráskódú eszközt Basic Pitch néven, hogy segítse az előadókat ötleteiket MIDI-hanganyaggá alakítani. Egy Forbes-cikk már a mesterséges intelligencia-eszközükről tudósított, amellyel

„egy popdal harmóniáját vegyük át, mondjuk Justin Biebertől vagy Drake-től, és azt kombináljuk Schubert vagy Bach fúgájának dallamával és ritmusával, ha úgy tetszik”.

Az Apple megvásárolta az egyik mesterséges intelligenciával foglalkozó zenei startupot, az AI Music- ot, a kínai zene streamelő óriás; a Tencent Music pedig szintetikus hangtechnológiát használva felépítette valódi sztárok hangján alapuló saját „AI énekeseit”, és már több mint ezer dalt dobott piacra ezek felhasználásával.

Sokan azon aggódnak, hogy a streaming szolgáltatások a mesterséges intelligencia által generált zenét arra fogják használni, hogy olyan háttérzenéket állítsanak elő, amelyekért nem kell jogdíjat fizetni a jogtulajdonosoknak és így az emberi zenészeknek sem.

A mesterséges intelligencia fejlesztések egyik nagy hala, a Stability AI októberben kapott 10 millió dolláros injekciójának köszönhetően jó forrásokkal rendelkezik. Alkalmazta az egyik mesterséges intelligencia-gurut, Ed Newton-Rex-et, a Jukedeck társalapítóját. Ez az egyik első AI zenei startup volt, amely nagy hullámokat keltett 2014-ben, mielőtt később a TikTok anyavállalata, a ByteDance megvásárolta volna. Newton-Rex jelenleg a Stability AI Harmonai csapatának termékért felelős alelnöke .

A Music Ally szerint az AI zenei rendszereket talán a szintetizátorokhoz vagy a dobgépekhez lehet hasonlítani. Mindkét technológia sok vitát szült a kezdeti időszakban, sokan akkor is attól tartottak, hogy megnehezítik az emberi zenészek megélhetését. Aztán kiderült, hogy ezeket az eszközöket találékony emberek új hangzások, sőt műfajok (hello, elektronikus zene és hip-hop) létrehozására használták.

2022-ben a BandLab elindított egy „SongStarter” nevű eszközt, ami mesterséges intelligencia segítségével ütemeket, dallamokat és akkordváltásokat generál. Mint a Spotify Basic Pitch technológiája.

Ennél fontosabb az amerikai Boomy startup, amelyik 2022-ben jelentős mérföldkőhöz érkezett: „Több mint 10 millió egyedi, eredeti dalt hoztak létre a Boomy-val” – jelentette be a cég novemberben.

Ez azt jelenti, hogy a Boomyt naponta körülbelül 14,8 ezer új dal létrehozására használták fel. Összehasonlításképpen, naponta körülbelül 100 ezer új kereskedelmi szám kerül be a streaming szolgáltatásokba.

A Boomy-n egy dal létrehozásához csak be kell állítani néhány opciót, majd meg kell nyomni egy gombot, hogy meghallgassuk az eredményt: ha tetszik, elmentjük, ha nem, kidobjuk. Most felkereshetjük ide kattintva a webhelyét, és egy óra alatt összedobhatunk néhány albumnyi számot – igaz lehet, hogy csak kettőt vagy hármat mentünk el.

A kiadók, zenei társaságok nagy része még mindig azon tűnődik, hogy jogilag mit kezdjenek a helyzettel, hogy lehet-e szerzőnek nevezni a mesterséges intelligenciát – mialatt a szoftverek milliószámra hajigálnak ki magukból dalokat, a streaming szolgáltatók és az AI startupok pedig létrehozzák, tárolják és forgalmazzák azokat.

Szerencsére sok művészt nem riaszt vissza a mesterséges intelligencia, hanem kreatívan felhasználja. Egy kísérletező elektronikus zenész, Holly Herndon projektje, az itt elérhető Holly+ a zene és a technológiai fejlesztés világát akarja áthidalni. A Herndon „digitális ikerpárjaként” létező Holly+ ugyanis egy „énekhangszer” és felület, amelyen bárki többszólamú hangot tölthet fel és azt Herndon hangján énekelve kapja vissza.

A Holly+-t a Never Before Heard Soundsszal együttműködésben fejlesztették ki. Az eszköz szellemi tulajdonát a DAO (Decentralized Autonomous Organisation) őrzi, a Holly+-t használó zenei licencelésből származó bevételt pedig új ötletek kidolgozására fordítják.

Ezek is érdekelhetik

Hírlevél feliratkozás
Ne maradjon le a vaol.hu legfontosabb híreiről! Adja meg a nevét és az e-mail-címét, és mi naponta elküldjük Önnek a legfontosabb híreinket!