DeepSeek, chiński startup z Hangzhou, wypuścił w piątek wersję preview swojego nowego modelu językowego V4. To pierwszy od dłuższego czasu poważny ruch tej firmy – i znów przykuwa uwagę całej branży.
Model V4 jest open source, podobnie jak poprzednik V3. Deweloperzy mogą go pobrać, uruchomić lokalnie i modyfikować wedle potrzeb. Firma udostępniła dwie wersje: „pro” i „flash” – różniące się rozmiarem i przeznaczeniem.
Co nowego w V4?
DeepSeek chwali się, że V4 osiąga mocne wyniki przede wszystkim w:
- zadaniach agentowych (agent-based tasks)
- przetwarzaniu wiedzy (knowledge processing)
- wnioskowaniu (inference)
Co ciekawe, firma podkreśla, że model zoptymalizowano pod kątem współpracy z popularnymi narzędziami agentowymi – w tym Claude Code od Anthropic oraz OpenClaw. To dość wymowne, że chiński model reklamuje się kompatybilnością z narzędziami swojej zachodniej konkurencji.
Kontekst: skąd wziął się DeepSeek?
Dla tych, którzy potrzebują przypomnienia: DeepSeek założono w 2023 roku. Pod koniec 2024 roku firma wypuściła model V3 – darmowy, open source, rzekomo wytrenowany za ułamek kosztów modeli OpenAI czy Google. Potem, w styczniu 2025 roku, pojawił się R1 – model rozumowania, który dosłownie wstrząsnął rynkami finansowymi.
Dlaczego? Bo DeepSeek ujawnił, że R1 powstał w dwa miesiące i kosztował poniżej 6 milionów dolarów – używając słabszych układów Nvidii. To postawiło pod znakiem zapytania sens miliardowych inwestycji zachodnich gigantów w infrastrukturę AI.
Każdy nowy model DeepSeeka to test dla całego ekosystemu AI – nie tylko techniczny, ale i rynkowy. Z jednej strony open source i niska cena trenowania to coś, z czego korzystają deweloperzy na całym świecie. Z drugiej – nasuwa się pytanie, co tak naprawdę wiemy o tym, jak te modele są trenowane, jakie dane wykorzystują i kto za tym stoi. Nie twierdzę, że jest tu złowrogi spisek, ale zdrowy sceptycyzm jest wskazany. Szczególnie gdy technologiczne supermocarstwa coraz wyraźniej traktują AI jako narzędzie polityki, a nie tylko produkt.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Presja konkurencyjna w Chinach
DeepSeek nie działa już w próżni. Chińska scena AI rozgrzała się do czerwoności – Alibaba i ByteDance również wypuściły w tym roku nowe modele. Rynek reaguje nerwowo: po piątkowym ogłoszeniu akcje kilku chińskich spółek AI spadły na giełdzie w Hongkongu. MiniMax i Zhipu (Knowledge Atlas Technology) straciły po około 8%, a Manycore Tech wręcz poleciało o 9%.
Pytanie o chipy – kluczowa zagadka
Jeden z największych znaków zapytania wokół V4 dotyczy sprzętu. Na jakich układach wytrenowano model?
Huawei potwierdził w piątek, że jego najnowszy klaster obliczeniowy oparty na procesorach Ascend AI jest w stanie obsłużyć model V4. Nie wiadomo jednak, w jakim stopniu chipy Huawei były faktycznie używane do trenowania – w porównaniu z układami Nvidii.
Chińskie firmy AI mają formalnie odcięty dostęp do najbardziej zaawansowanych procesorów Nvidii ze względu na amerykańskie kontrole eksportowe. Pekin z kolei aktywnie naciska na chińskie firmy technologiczne, by przechodziły na krajowe alternatywy – w tym właśnie rozwiązania Huawei.
To nie jest tylko kwestia techniczna. To jeden z frontów szerszej technologicznej rywalizacji USA–Chiny, której AI stała się centralnym polem bitwy.
