DeepSeek V4 – chiński startup znów miesza w branży AI

0:00

DeepSeek, chiński startup z Hangzhou, wypuścił w piątek wersję preview swojego nowego modelu językowego V4. To pierwszy od dłuższego czasu poważny ruch tej firmy – i znów przykuwa uwagę całej branży.

Model V4 jest open source, podobnie jak poprzednik V3. Deweloperzy mogą go pobrać, uruchomić lokalnie i modyfikować wedle potrzeb. Firma udostępniła dwie wersje: „pro” i „flash” – różniące się rozmiarem i przeznaczeniem.

Spis treści:

🔥 RAPORT: Polska firma w erze AI 2026 - Weź udział w ankiecie

Jeśli chcesz otrzymać raport przed oficjalną premierą oraz zobaczyć nazwę swojej firmy wśród uczestników badania – zostaw adres email na końcu ankiety.

Co nowego w V4?

DeepSeek chwali się, że V4 osiąga mocne wyniki przede wszystkim w:

zadaniach agentowych (agent-based tasks)
przetwarzaniu wiedzy (knowledge processing)
wnioskowaniu (inference)

Co ciekawe, firma podkreśla, że model zoptymalizowano pod kątem współpracy z popularnymi narzędziami agentowymi – w tym Claude Code od Anthropic oraz OpenClaw. To dość wymowne, że chiński model reklamuje się kompatybilnością z narzędziami swojej zachodniej konkurencji.

Kontekst: skąd wziął się DeepSeek?

Dla tych, którzy potrzebują przypomnienia: DeepSeek założono w 2023 roku. Pod koniec 2024 roku firma wypuściła model V3 – darmowy, open source, rzekomo wytrenowany za ułamek kosztów modeli OpenAI czy Google. Potem, w styczniu 2025 roku, pojawił się R1 – model rozumowania, który dosłownie wstrząsnął rynkami finansowymi.

Dlaczego? Bo DeepSeek ujawnił, że R1 powstał w dwa miesiące i kosztował poniżej 6 milionów dolarów – używając słabszych układów Nvidii. To postawiło pod znakiem zapytania sens miliardowych inwestycji zachodnich gigantów w infrastrukturę AI.

Każdy nowy model DeepSeeka to test dla całego ekosystemu AI – nie tylko techniczny, ale i rynkowy. Z jednej strony open source i niska cena trenowania to coś, z czego korzystają deweloperzy na całym świecie. Z drugiej – nasuwa się pytanie, co tak naprawdę wiemy o tym, jak te modele są trenowane, jakie dane wykorzystują i kto za tym stoi. Nie twierdzę, że jest tu złowrogi spisek, ale zdrowy sceptycyzm jest wskazany. Szczególnie gdy technologiczne supermocarstwa coraz wyraźniej traktują AI jako narzędzie polityki, a nie tylko produkt.

Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl

Presja konkurencyjna w Chinach

DeepSeek nie działa już w próżni. Chińska scena AI rozgrzała się do czerwoności – Alibaba i ByteDance również wypuściły w tym roku nowe modele. Rynek reaguje nerwowo: po piątkowym ogłoszeniu akcje kilku chińskich spółek AI spadły na giełdzie w Hongkongu. MiniMax i Zhipu (Knowledge Atlas Technology) straciły po około 8%, a Manycore Tech wręcz poleciało o 9%.

Pytanie o chipy – kluczowa zagadka

Jeden z największych znaków zapytania wokół V4 dotyczy sprzętu. Na jakich układach wytrenowano model?

Huawei potwierdził w piątek, że jego najnowszy klaster obliczeniowy oparty na procesorach Ascend AI jest w stanie obsłużyć model V4. Nie wiadomo jednak, w jakim stopniu chipy Huawei były faktycznie używane do trenowania – w porównaniu z układami Nvidii.

Chińskie firmy AI mają formalnie odcięty dostęp do najbardziej zaawansowanych procesorów Nvidii ze względu na amerykańskie kontrole eksportowe. Pekin z kolei aktywnie naciska na chińskie firmy technologiczne, by przechodziły na krajowe alternatywy – w tym właśnie rozwiązania Huawei.

To nie jest tylko kwestia techniczna. To jeden z frontów szerszej technologicznej rywalizacji USA–Chiny, której AI stała się centralnym polem bitwy.

Oceń artykuł

Średnia: 4.8 (19 ocen)

DeepSeek V4 – chiński startup znów miesza w branży AI

🔥 RAPORT: Polska firma w erze AI 2026 - Weź udział w ankiecie

Musk kontra Altman: Proces stulecia w świecie AI ruszył w Oakland

Mówisz szybciej niż piszesz. Nothing to wie

mBank na EKG 2026: AI trzeba planować od zera, nie przyklejać do starych procesów

Musk kontra Altman: Proces stulecia w świecie AI ruszył w Oakland

Mówisz szybciej niż piszesz. Nothing to wie

mBank na EKG 2026: AI trzeba planować od zera, nie przyklejać do starych procesów

Jak modele AI interpretują rynek kryptowalut w czasie rzeczywistym

Jesteś z nami!

na skróty

Spotkajmy się

tematy

AI w praktyce

Najnowsze artykuły

Musk kontra Altman: Proces stulecia w świecie AI ruszył w Oakland

Mówisz szybciej niż piszesz. Nothing to wie

mBank na EKG 2026: AI trzeba planować od zera, nie przyklejać do starych procesów

Jak modele AI interpretują rynek kryptowalut w czasie rzeczywistym

AIport.pl - o nas

DeepSeek V4 – chiński startup znów miesza w branży AI

Co nowego w V4?

Kontekst: skąd wziął się DeepSeek?

Presja konkurencyjna w Chinach

Pytanie o chipy – kluczowa zagadka

Przeczytaj podobne artykuły:

Jesteś z nami!

na skróty

Spotkajmy się

tematy

AI w praktyce

Najnowsze artykuły

AIport.pl - o nas