Kris Sampson siedziała przy biurku w Montanie i pracowała zdalnie, gdy zadzwoniła „córka”. To był jej głos, jej płacz, jej panika. Przez 20 minut matka balansowała na granicy zawału, zanim udało się potwierdzić, że córka siedzi bezpiecznie w pracy. Sprawcy nie ustalono. Pieniędzy nie wyłudzono, ale coś zostało złamane na dobre: zaufanie do dźwięku znajomego głosu.
Kluczowe fakty:
- Narzędzia do klonowania głosu wymagają obecnie tylko trzech sekund nagrania, aby odtworzyć barwę, intonację i emocje konkretnej osoby. Materiał można pozyskać z mediów społecznościowych, nagrań poczty głosowej czy wywiadów internetowych.
- Federalna Komisja Handlu USA odnotowała w 2025 roku wzrost oszustw wykorzystujących klonowanie głosu o 19%, a straty wyniosły ponad 3,5 miliarda dolarów. Najbardziej spektakularny przypadek to kradzież 35 milionów dolarów od menedżera bankowego w Hongkongu.
- Naukowiec Sanket Badhe z Rutgers University zbudował w 2025 roku system AI, który autonomicznie wybierał ofiary, klonował głosy bliskich osób i prowadził rozmowy w czasie rzeczywistym bez udziału człowieka.
To nie jest historia wyjątkowa. To już schemat.
Trzy sekundy wystarczą
Narzędzia do klonowania głosu działają dziś na próbkach długości trzech sekund. Tyle wystarczy algorytmowi, żeby odtworzyć barwę, intonację i emocje konkretnej osoby. Materiał? Każdy film z mediów społecznościowych, nagranie poczty głosowej, wywiad w internecie. Większość z nas hojnie zasila te bazy danych każdego dnia.
Do tego dochodzi spoofing, czyli technika podrabiania numeru telefonu widocznego na ekranie. Efekt jest przerażający: dzwoni „córka” i wyświetla się zdjęcie córki z książki kontaktów, bo połączenie faktycznie pochodzi z jej numeru… tyle że fałszywego, wygenerowanego przez serwer po drugiej stronie Ziemi.
Federalna Komisja Handlu USA odnotowała w 2025 roku wzrost tego typu oszustw o 19 proc. Straty: ponad 3,5 mld dolarów.
W Polsce mechanizm działa od lat pod nazwą „na wnuczka”. AI go nie wymyśliła, ale radykalnie go udoskonala.
„Uprzemysłowione” oszustwa
Ian Bednowitz z firmy LifeLock celnie opisuje skalę problemu: przez dekady znajomy numer na ekranie był sygnałem zaufania. Dziś to założenie przestało działać.
Za procederem stoją zorganizowane sieci, głównie z Azji Południowo-Wschodniej i Afryki, działające jak regularni pracodawcy. Mają działy HR, gotowe skrypty, targety sprzedażowe. Wielu „pracowników” to ofiary handlu ludźmi, działające pod przymusem.
Obserwuję to zjawisko od kilku lat i widzę wyraźny podział w publicznej dyskusji: jedni biją na alarm, że AI to narzędzie zbrodni, inni odpowiadają, że strach jest przesadzony i że „stary dobry vishing” też działał bez żadnego deepfake’u. Obie strony mają rację – i właśnie to jest problem. Bo kiedy granica między uzasadnionym niepokojem a paniką jest rozmyta, ludzie albo przesadzają z ostrożnością, albo bagatelizują zagrożenie. Pytanie, które mnie nurtuje, brzmi inaczej: czy jesteśmy gotowi na świat, w którym miliony autonomicznych botów będą jednocześnie dzwonić do milionów ludzi, podszywając się pod ich bliskich? Bo infrastruktura do tego powoli powstaje.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
W 2025 roku naukowiec Sanket Badhe z Rutgers University zbudował system AI, który sam wybierał ofiarę, klonował głos bliskiej osoby, prowadził rozmowę i reagował na odpowiedzi w czasie rzeczywistym. Bez żadnego człowieka w pętli.
Nie był to eksperyment z zakresu science fiction. Był to dowód koncepcji.
Trzy sekundy i 35 milionów dolarów
Najbardziej spektakularny znany przypadek to atak na menedżera bankowego w Hongkongu. Przestępcy sklonowali głos jego szefa i zlecili przelew 35 mln dolarów na „zakup nowej spółki”. Menedżer rozpoznał głos, nie wątpił, autoryzował transakcję.
Warto to powtórzyć: nie był to atak na starszą panią, która nie zna się na technologii. To był atak na profesjonalistę, który tę technologię zna.
Eksperci ds. cyberbezpieczeństwa mówią o vishingu (voice phishing) jako o zagrożeniu zmieniającym kategorię. Współczesne modele generatywne potrafią naśladować nie tylko barwę głosu, ale też panikę, zadyszkę, płacz. Realizm rośnie szybciej niż świadomość zagrożenia.
Czy zawsze chodzi o deepfake?
Warto jednak zachować proporcje.
Eksperci podkreślają, że nie każdy taki przypadek musi oznaczać zaawansowaną technologię. Silny stres zaburza percepcję, mózg „dopowiada” znajome brzmienie, a sprawna manipulacja psychologiczna często nie potrzebuje żadnego algorytmu. Część oszustów korzysta z AI, część po prostu dobrze odgrywa sceny.
To nie zmniejsza zagrożenia. Raczej komplikuje obraz.
Jak się bronić? Kilka konkretnych zasad
Specjaliści rekomendują zestaw prostych, ale skutecznych środków ostrożności:
- Rodzinne hasło bezpieczeństwa – słowo lub fraza, które „dzwoniący krewny” musi podać, żeby potwierdzić tożsamość. AI nie znajdzie go w sieci.
- Weryfikacja dwukanałowa – w przypadku podejrzanego telefonu rozłącz się i sam oddzwoń na znany numer.
- Ogranicz nagrania głosu w social media – im mniej próbek publicznie dostępnych, tym trudniej o klon.
- Pytania kontrolne – szczegóły, które zna tylko bliska osoba, a nie algorytm trenowany na publicznych danych.
- Zasada JDA (Just Don’t Answer) – po prostu nie odbieraj nieznanych numerów.
Problem w tym, że żadna z tych metod nie zadziała, jeśli wyświetlony numer naprawdę należy do bliskiej osoby i mamy jej zdjęcie w kontaktach.
Prawo nie nadąża
Ściganie sprawców działających z innych kontynentów pozostaje ekstremalnie trudne. Eksperci apelują do operatorów telekomunikacyjnych o szersze wdrażanie standardów STIR/SHAKEN, które pozwalają weryfikować autentyczność numeru i utrudniają spoofing. W Polsce te mechanizmy wciąż są słabo rozwinięte.
Kris Sampson i jej rodzina ustalili własne hasło bezpieczeństwa. Dziś mówi: „I’m determined to spread awareness so no other mother has to experience that paralyzing fear” („Jestem zdecydowana nagłaśniać ten problem, żeby żadna inna matka nie musiała przeżywać tego paraliżującego strachu”).
Brzmi jak prywatna historia. Ale to już problem systemowy.
Czasy, gdy głos w telefonie automatycznie oznaczał konkretną osobę, bezpowrotnie minęły. I chyba powinniśmy zacząć się do tego dostosowywać, zanim zrobi to za nas ktoś z zupełnie innych pobudek.
