Raport AI Index 2025, opublikowany przez Stanford Institute for Human-Centered Artificial Intelligence (HAI), to już ósma edycja najbardziej wyczerpującego dorocznego przeglądu stanu sztucznej inteligencji na świecie. Na ponad 400 stronach znajdziemy dane o postępach technicznych, inwestycjach, regulacjach prawnych, wpływie na rynek pracy i nastrojach społecznych – wszystko oparte na twardych liczbach, nie spekulacjach.
AI bije rekordy na benchmarkach – ale czy to coś znaczy?
Na benchmarku SWE-bench, który testuje zdolność modeli do rozwiązywania rzeczywistych problemów z inżynierii oprogramowania, wyniki skoczyły z 4,4% w 2023 roku do 71,7% w 2024 roku. To wzrost o 67,3 punktu procentowego w ciągu jednego roku. Podobnie wyglądają wyniki na MMMU (wzrost o 18,8 pp.) i GPQA (wzrost o 48,9 pp.).
Problem w tym, że benchmarki coraz szybciej przestają być miarodajne. Vanessa Parli, jedna z autorek raportu, wprost mówi: „Every year, we look at how these algorithms are performing across benchmarks, and every year it seems like they’re beating those benchmarks” / „Każdego roku patrzymy, jak algorytmy radzą sobie na benchmarkach, i każdego roku je pokonują.” Pojawia się fundamentalne pytanie: czy w ogóle mierzymy właściwe rzeczy?
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl: Dane ze Stanfordu są imponujące, ale trzeba je czytać z pewną dozą ostrożności. Skokowe wzrosty na benchmarkach robią wrażenie, jednak historia uczy, że modele potrafią „nauczyć się zdawać egzaminy”, niekoniecznie rozumiejąc materię. Z drugiej strony – jeśli AI rozwiązuje prawdziwe problemy z kodowaniem z 70-procentową skutecznością, to trudno to bagatelizować. Pytanie, które mnie naprawdę nurtuje, brzmi: czy jesteśmy w stanie wyprzedzić tempo zmian odpowiednimi narzędziami oceny, zanim rzeczywiste zastosowania daleko przerosną nasze możliwości pomiaru ryzyka?
Koszty użycia AI spadają w zawrotnym tempie
Koszt zapytania do modelu AI osiągającego wyniki równoważne GPT-3.5 spadł z 20 dolarów za milion tokenów w listopadzie 2022 roku do zaledwie 0,07 dolara za milion tokenów w październiku 2024 roku – to ponad 280-krotna redukcja.
Jednocześnie w 2022 roku najmniejszy model uzyskujący ponad 60% na benchmarku MMLU to był PaLM z 540 miliardami parametrów. W 2024 roku ten sam wynik osiągnął Microsoft Phi-3-mini – model zaledwie 3,8 miliarda parametrów. Redukcja 142-krotna w ciągu dwóch lat.
To zmienia rachunek ekonomiczny dla firm rozważających wdrożenia AI diametralnie.
Biznes przyspiesza – i to mocno
W 2024 roku odsetek organizacji korzystających z AI wzrósł do 78%, wobec 55% w roku poprzednim. Liczba respondentów deklarujących użycie generatywnej AI w co najmniej jednej funkcji biznesowej więcej niż się podwoiła – z 33% w 2023 roku do 71% w 2024 roku.
Kluczowe trendy po stronie inwestycji wyglądają następująco:
- Globalne prywatne inwestycje w AI osiągnęły 252,3 miliarda dolarów w 2024 roku, co oznacza wzrost o 44,5% rok do roku.
- Prawie 90% znaczących modeli AI w 2024 roku pochodzi z laboratoriów przemysłowych, wobec 60% w 2023 roku.
- Stany Zjednoczone wyprodukowały 40 znaczących modeli AI w 2024 roku, znacznie wyprzedzając Chiny (15 modeli) i Europę (3 modele).
AI w medycynie – od ciekawostki do standardu
Liczba zatwierdzonych przez FDA urządzeń medycznych wykorzystujących AI wzrosła z zaledwie 6 w 2015 roku do 223 w 2023 roku – wzrost 37-krotny. Do tego dochodzą badania wskazujące, że GPT-4 osiąga 92-procentową dokładność diagnostyczną – wyżej niż lekarze wspomagani tym samym modelem (76%) czy tradycyjne metody diagnostyki (74%).
Incydenty rosną szybciej niż regulacje
Liczba incydentów związanych z AI wzrosła do 233 w 2024 roku – to rekord i wzrost o 56,4% wobec 2023 roku. Wśród zgłoszonych przypadków znalazły się deepfake’i z intymnymi wizerunkami oraz chatboty powiązane ze śmiercią nastolatka.
Zaufanie do firm AI w kwestii ochrony danych osobowych spadło z 50% do 47% między 2023 a 2024 rokiem. To może wyglądać skromnie, ale to część długoterminowego trendu spadkowego.
Paradoks zaufania: więcej AI, mniej entuzjazmu
Kraje z największymi inwestycjami w AI, w tym Stany Zjednoczone, wykazują większy sceptycyzm wobec produktów i usług AI niż kraje z mniejszym zaangażowaniem. W USA tylko 39% ankietowanych uważa, że produkty AI przynoszą więcej korzyści niż szkód. W Indonezji ten odsetek sięga 80%.
Można to czytać dwojako: albo jako efekt dojrzałości rynku, albo jako sygnał ostrzegawczy dla całej branży.
Regulacje: stany przejmują inicjatywę
W 2016 roku uchwalono zaledwie jedno prawo stanowe w USA dotyczące AI. W 2023 roku było ich 49, a w 2024 roku liczba ta przekroczyła 131. Jednocześnie liczba uchwalonych przepisów na poziomie federalnym pozostaje niska mimo rosnącej liczby projektów.
Raport podkreśla, że luka między tym, co AI potrafi, a tym, na co społeczeństwo jest gotowe, pozostaje centralnym wyzwaniem obecnej ery AI.
Pełny raport dostępny jest na stronie Stanford HAI: hai.stanford.edu
