ElevenLabs właśnie ogłosiło premierę Music v2 – nowego modelu do generowania muzyki, który potrafi zmieniać gatunki w trakcie jednego utworu. To nie jest drobna aktualizacja – firma przesuwa granicę tego, co w ogóle uważaliśmy za możliwe w AI music generation.
Kluczowe fakty:
- ElevenLabs wypuściło Music v2 – model AI do generowania muzyki, który potrafi płynnie zmieniać gatunki w trakcie jednego utworu, na przykład przechodzić z opery do heavy metalu bez utraty spójności kompozycji.
- Model oferuje funkcję inpainting, pozwalającą edytować wybrane fragmenty gotowego utworu bez wpływu na resztę nagrania oraz budować pełne struktury piosenek sekcja po sekcji.
- Music v2 napędza trzy różne produkty: ElevenMusic dla muzyków, ElevenCreative dla agencji marketingowych i ElevenAPI dla deweloperów chcących zintegrować generator muzyki ze swoimi aplikacjami.
Nowy model radzi sobie z czymś, co dotychczas konsekwentnie sprawiało problemem wszystkim narzędziom tego rodzaju: utrzymaniem spójności przy skrajnych zmianach nastroju i stylu. Jeden utwór może płynnie przejść z opery do heavy metalu i z powrotem, utrzymać szybkie flow rapowe bez utraty zrozumiałości tekstu, a nawet wpleść w strukturę muzyczną niemuzyczne efekty dźwiękowe – i to wszystko bez rozsypania się kompozycji.
Inpainting, czyli edycja bez burzenia całości
Jedną z najbardziej praktycznych funkcji Music v2 jest ulepszone inpainting. Twórca może wskazać dowolny fragment gotowego utworu – na przykład bridge albo jeden wers – i poprosić model o jego regenerację przy użyciu nowego promptu. Reszta nagrania pozostaje nietknięta. To zmienia sposób pracy z AI-muzyką z „generuj i wybieraj” na coś znacznie bliższego prawdziwemu procesowi twórczemu.
Znika też ograniczenie krótkich klipów. Zamiast tworzyć urywki, użytkownik buduje teraz pełną strukturę piosenki sekcja po sekcji: intro, wers, refren i co tylko potrzeba, a model dba o spójność między kolejnymi fragmentami. ElevenLabs zaznacza też wyraźną poprawę w obsłudze wielu języków – zarówno pod kątem wymowy, jak i naturalności wokalu.
Trzy platformy, trzy grupy odbiorców
Music v2 napędza jednocześnie trzy produkty ElevenLabs, każdy skierowany do innej grupy:
- ElevenMusic – platforma dla muzyków i twórców, pozwala budować pełne kompozycje od szkicu do gotowego nagrania, remixować istniejące utwory i eksperymentować z gatunkami
- ElevenCreative – narzędzie dla agencji i zespołów marketingowych, obsługuje muzykę licencjonowaną na potrzeby reklam i contentu brandingowego bez opłat sync ani clearance
- ElevenAPI – interfejs dla deweloperów, którzy chcą zintegrować generowanie muzyki bezpośrednio we własnych produktach (dostępność dla Music v2 zapowiedziana w najbliższym czasie)
Przy okazji premiery ElevenLabs obniżył ceny obu wersji modelu – Music v1 i v2 – nawet o 50% w ramach ElevenAPI i do 40% dla klientów ElevenCreative.
Kwestia licencji: tu leży prawdziwy problem branży
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl: Technologicznie Music v2 robi wrażenie i nie ma co tego udawać. Ale prawdziwy test dla całego sektora AI music to nie jakość generowanego dźwięku, tylko stosunek do praw autorskich. ElevenLabs wprost komunikuje, że model trenowany był wyłącznie na licencjonowanych danych i że każdy wygenerowany utwór jest wolny od ograniczeń prawnych. To poważna deklaracja na tle konkurencji – Suno i Udio mierzą się z procesami sądowymi wytoczonymi przez największe wytwórnie muzyczne. Z drugiej strony pojawia się pytanie, które będzie coraz trudniejsze do zignorowania: co dokładnie oznacza „licencjonowane dane” i czy artyści, których nagrania posłużyły do treningu, zostali odpowiednio wynagrodzeni i poinformowani? Deklaracja zgodności z prawem to nie to samo co uczciwe partnerstwo z twórcami. Chciałbym widzieć więcej transparentności w tym obszarze od wszystkich graczy w tej przestrzeni.
ElevenLabs zaznacza, że najnowsze wydanie wpisuje się w rosnący trend licencyjnych porozumień z branżą muzyczną. Firma nawiązała współpracę z dystrybutorem Believe i obserwuje, jak cały rynek stopniowo przechodzi od modelu „trenuj na czym popadnie” do podejścia opartego na umowach. To wyraźny kontrast z sytuacją prawną konkurentów – Universal Music Group i Sony Music rozszerzają pozwy przeciwko Suno i Udio, dokładając kolejne dziesiątki tysięcy chronionych nagrań do listy zarzutów.
Wyścig trwa – i to szybki
ElevenLabs nie jest oczywiście jedynym graczem. Ostatnie miesiące to prawdziwy sprint w sektorze AI music generation:
- Google uruchomiło Lyria 3 Pro i rozbudowało narzędzie Flow Music o generowanie teledysków oraz edycję sekcjonową
- Stability AI wypuściło model zdolny do tworzenia sześciominutowych kompozycji
- Suno ogłosiło wersję v5.5 z rozszerzonymi możliwościami tworzenia dłuższych i bardziej złożonych struktur
Na tym tle Music v2 wyróżnia się przede wszystkim spójnością: możliwością prowadzenia rozbudowanej kompozycji przez zmiany gatunkowe bez utraty logiki muzycznej. To coś, co dla twórców treści i muzyków pracujących z AI może okazać się ważniejsze niż surowe tempo generowania.
Music v2 dostępny jest teraz w ElevenMusic i ElevenCreative. Dostęp przez API zapowiedziany jest wkrótce – firma umożliwia już zgłaszanie się do programu wczesnego dostępu.
