DeepSeek szykuje się do premiery nowego modelu. V4 ma być multimodalny – obsługiwać tekst, obrazy i wideo – a jego premiera zaplanowana jest na przyszły tydzień, tuż przed chińskim parlamentarnym zjazdem „Dwa Posiedzenia”. To pierwszy poważny launch chińskiego laboratorium od stycznia 2025 roku, kiedy świat poznał R1 i przeżył krótkie trzęsienie ziemi na rynkach.
Informacje o planach DeepSeeka podały dwie osoby zaznajomione ze sprawą. Poinformowały one Financial Times, że model V4 jest optymalizowany nie pod chipy Nvidii, lecz pod produkty chińskich producentów – Huawei i Cambricon. To ważny sygnał. Nie chodzi tylko o jeden model, ale o coś znacznie większego: systematyczne uniezależnianie się chińskiego ekosystemu AI od amerykańskich procesorów.
Timing nie jest przypadkowy. „Dwa Posiedzenia” – doroczne spotkanie chińskiego parlamentu – startują 4 marca. DeepSeek może przy tej okazji zyskać oficjalny status technologicznego czempiona narodowego. A Pekin od dawna szuka takiej historii sukcesu.
Rok przerwy i nacisk konkurencji
Przez ostatnie ponad dwanaście miesięcy DeepSeek nie wypuszczał dużych modeli – ograniczał się do drobnych aktualizacji. W tym czasie rywale nie spali. Alibaba i Moonshot zdążyli zagospodarować rosnący apetyt rynku na tanie, open-source’owe modele chińskiej produkcji. V4 ma być odpowiedzią na tę presję.
Co ważne, DeepSeek planuje publikację materiałów technicznych w dwóch etapach: skrócona nota pojawi się przy premierze modelu, a pełny raport techniczny – mniej więcej miesiąc później.
„DeepSeek wywołał w zeszłym roku sporo szumu i zasłużył na część pochwał – R1 był naprawdę solidnym wynikiem przy ograniczonych zasobach,” mówi Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl. „Ale teraz rynek jest bardziej wymagający. Samo hasło 'zrobiłem to taniej’ już nie wystarczy – trzeba pokazać, że model faktycznie działa na poziomie światowym. Optymalizacja pod chipy Huawei to z jednej strony logiczny krok w kierunku suwerenności technologicznej. Z drugiej – jeśli to opóźnia możliwości treningowe lub obniża jakość, to pyrrusowe zwycięstwo. Szczerze? Czekam na liczby, a nie komunikaty prasowe.”
Huawei w tle, Nvidia wciąż dominuje
Relacja DeepSeeka z Nvidią jest jasna: firma nie współpracowała z amerykańskim gigantem przy optymalizacji V4. Nvidia pozostaje niekwestionowanym liderem w chipach do trenowania modeli, szczególnie w fazie pre-trainingu, gdzie modele przetwarzają ogromne ilości danych. To jest ta część procesu, gdzie DeepSeek próbował pracować na sprzęcie Huawei i – według wcześniejszych doniesień FT – napotkał poważne trudności techniczne.
Inference, czyli generowanie odpowiedzi przez gotowy model, to inna historia. Tu chipy Huawei i Cambricon mają realną szansę konkurować – i właśnie tam DeepSeek celuje z V4.
Kilka rzeczy warto mieć na uwadze przy ocenie tej premiery:
- V4 to model multimodalny – obsługuje tekst, obraz i wideo jednocześnie
- Optymalizacja pod Huawei i Cambricon to wyraźny sygnał odejścia od zachodniego sprzętu
- Premiera przed „Dwoma Posiedzeniami” wpisuje się w narrację technologicznego sukcesu Chin
- Pełny raport techniczny pojawi się dopiero miesiąc po premierze modelu
Cień Anthropica i zarzuty o distillation
Tuż przed tą premierą Anthropic publicznie oskarżyło DeepSeeka – oraz dwa inne chińskie laboratoria AI – o stosowanie tzw. distillation attacks. Chodzi o praktykę trenowania mniejszych modeli na wynikach generowanych przez bardziej zaawansowane systemy. W ten sposób można osiągnąć porównywalną jakość bez ponoszenia pełnych kosztów obliczeniowych i bez dostępu do oryginalnych danych treningowych.
DeepSeek, Huawei i Cambricon nie odpowiedziały na prośby o komentarz.
Premiera V4 będzie testem – nie tylko dla DeepSeeka, ale dla całego chińskiego ekosystemu AI. Jeśli model faktycznie okaże się konkurencyjny wobec zachodnich alternatyw i zadziała sprawnie na chipach Huawei, to zmieni układ sił w branży. Jeśli nie – rok przerwy będzie trudno wytłumaczyć.
