Kiedy głos w telefonie brzmi jak twoje dziecko, ale to nie ono

Autor i odp. redakcyjna: Natalia Kaszubowska | Data: 10 maja 2026, godz. 09:58 | Czas czytania: około 5 minut | Tekst: redakcja z użyciem AI | Audio: wygenerowane przez AI zgodnie z polityką AI portalu.

Kris Sampson siedziała przy biurku w Montanie i pracowała zdalnie, gdy zadzwoniła „córka”. To był jej głos, jej płacz, jej panika. Przez 20 minut matka balansowała na granicy zawału, zanim udało się potwierdzić, że córka siedzi bezpiecznie w pracy. Sprawcy nie ustalono. Pieniędzy nie wyłudzono, ale coś zostało złamane na dobre: zaufanie do dźwięku znajomego głosu.

Kluczowe fakty:

Narzędzia do klonowania głosu wymagają obecnie tylko trzech sekund nagrania, aby odtworzyć barwę, intonację i emocje konkretnej osoby. Materiał można pozyskać z mediów społecznościowych, nagrań poczty głosowej czy wywiadów internetowych.
Federalna Komisja Handlu USA odnotowała w 2025 roku wzrost oszustw wykorzystujących klonowanie głosu o 19%, a straty wyniosły ponad 3,5 miliarda dolarów. Najbardziej spektakularny przypadek to kradzież 35 milionów dolarów od menedżera bankowego w Hongkongu.
Naukowiec Sanket Badhe z Rutgers University zbudował w 2025 roku system AI, który autonomicznie wybierał ofiary, klonował głosy bliskich osób i prowadził rozmowy w czasie rzeczywistym bez udziału człowieka.

Spis treści:

To nie jest historia wyjątkowa. To już schemat.

🗺️ Największy katalog firm AI w Polsce (467 firm)

Znajdź dostawcę, partnera lub narzędzie dla swojego biznesu, a jeśli prowadzisz firmę, która w swoim DNA ma AI, skorzystaj z możliwości bezpłatnego dodania swojej firmy.

Trzy sekundy wystarczą

Narzędzia do klonowania głosu działają dziś na próbkach długości trzech sekund. Tyle wystarczy algorytmowi, żeby odtworzyć barwę, intonację i emocje konkretnej osoby. Materiał? Każdy film z mediów społecznościowych, nagranie poczty głosowej, wywiad w internecie. Większość z nas hojnie zasila te bazy danych każdego dnia.

Do tego dochodzi spoofing, czyli technika podrabiania numeru telefonu widocznego na ekranie. Efekt jest przerażający: dzwoni „córka” i wyświetla się zdjęcie córki z książki kontaktów, bo połączenie faktycznie pochodzi z jej numeru… tyle że fałszywego, wygenerowanego przez serwer po drugiej stronie Ziemi.

Federalna Komisja Handlu USA odnotowała w 2025 roku wzrost tego typu oszustw o 19 proc. Straty: ponad 3,5 mld dolarów.

W Polsce mechanizm działa od lat pod nazwą „na wnuczka”. AI go nie wymyśliła, ale radykalnie go udoskonala.

Chcesz czytać więcej treści związanych z AI?

Dodaj AIPORT.pl do preferowanych źródeł Google

„Uprzemysłowione” oszustwa

Ian Bednowitz z firmy LifeLock celnie opisuje skalę problemu: przez dekady znajomy numer na ekranie był sygnałem zaufania. Dziś to założenie przestało działać.

Za procederem stoją zorganizowane sieci, głównie z Azji Południowo-Wschodniej i Afryki, działające jak regularni pracodawcy. Mają działy HR, gotowe skrypty, targety sprzedażowe. Wielu „pracowników” to ofiary handlu ludźmi, działające pod przymusem.

Obserwuję to zjawisko od kilku lat i widzę wyraźny podział w publicznej dyskusji: jedni biją na alarm, że AI to narzędzie zbrodni, inni odpowiadają, że strach jest przesadzony i że „stary dobry vishing” też działał bez żadnego deepfake’u. Obie strony mają rację – i właśnie to jest problem. Bo kiedy granica między uzasadnionym niepokojem a paniką jest rozmyta, ludzie albo przesadzają z ostrożnością, albo bagatelizują zagrożenie. Pytanie, które mnie nurtuje, brzmi inaczej: czy jesteśmy gotowi na świat, w którym miliony autonomicznych botów będą jednocześnie dzwonić do milionów ludzi, podszywając się pod ich bliskich? Bo infrastruktura do tego powoli powstaje.

Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl

W 2025 roku naukowiec Sanket Badhe z Rutgers University zbudował system AI, który sam wybierał ofiarę, klonował głos bliskiej osoby, prowadził rozmowę i reagował na odpowiedzi w czasie rzeczywistym. Bez żadnego człowieka w pętli.

Nie był to eksperyment z zakresu science fiction. Był to dowód koncepcji.

Trzy sekundy i 35 milionów dolarów

Najbardziej spektakularny znany przypadek to atak na menedżera bankowego w Hongkongu. Przestępcy sklonowali głos jego szefa i zlecili przelew 35 mln dolarów na „zakup nowej spółki”. Menedżer rozpoznał głos, nie wątpił, autoryzował transakcję.

Warto to powtórzyć: nie był to atak na starszą panią, która nie zna się na technologii. To był atak na profesjonalistę, który tę technologię zna.

Eksperci ds. cyberbezpieczeństwa mówią o vishingu (voice phishing) jako o zagrożeniu zmieniającym kategorię. Współczesne modele generatywne potrafią naśladować nie tylko barwę głosu, ale też panikę, zadyszkę, płacz. Realizm rośnie szybciej niż świadomość zagrożenia.

Czy zawsze chodzi o deepfake?

Warto jednak zachować proporcje.

Eksperci podkreślają, że nie każdy taki przypadek musi oznaczać zaawansowaną technologię. Silny stres zaburza percepcję, mózg „dopowiada” znajome brzmienie, a sprawna manipulacja psychologiczna często nie potrzebuje żadnego algorytmu. Część oszustów korzysta z AI, część po prostu dobrze odgrywa sceny.

To nie zmniejsza zagrożenia. Raczej komplikuje obraz.

Jak się bronić? Kilka konkretnych zasad

Specjaliści rekomendują zestaw prostych, ale skutecznych środków ostrożności:

Rodzinne hasło bezpieczeństwa – słowo lub fraza, które „dzwoniący krewny” musi podać, żeby potwierdzić tożsamość. AI nie znajdzie go w sieci.
Weryfikacja dwukanałowa – w przypadku podejrzanego telefonu rozłącz się i sam oddzwoń na znany numer.
Ogranicz nagrania głosu w social media – im mniej próbek publicznie dostępnych, tym trudniej o klon.
Pytania kontrolne – szczegóły, które zna tylko bliska osoba, a nie algorytm trenowany na publicznych danych.
Zasada JDA (Just Don’t Answer) – po prostu nie odbieraj nieznanych numerów.

Problem w tym, że żadna z tych metod nie zadziała, jeśli wyświetlony numer naprawdę należy do bliskiej osoby i mamy jej zdjęcie w kontaktach.

Ludzie polskiego AI: indeks 125 firm i ludzi

Za każdą polską firmą AI stoi konkretny człowiek z imieniem i nazwiskiem, często ten sam w kilku miejscach naraz, i to właśnie ludzie, nie tabelki finansowania, są prawdziwym bohaterem tego artykułu.

Prawo nie nadąża

Ściganie sprawców działających z innych kontynentów pozostaje ekstremalnie trudne. Eksperci apelują do operatorów telekomunikacyjnych o szersze wdrażanie standardów STIR/SHAKEN, które pozwalają weryfikować autentyczność numeru i utrudniają spoofing. W Polsce te mechanizmy wciąż są słabo rozwinięte.

Kris Sampson i jej rodzina ustalili własne hasło bezpieczeństwa. Dziś mówi: „I’m determined to spread awareness so no other mother has to experience that paralyzing fear” („Jestem zdecydowana nagłaśniać ten problem, żeby żadna inna matka nie musiała przeżywać tego paraliżującego strachu”).

Brzmi jak prywatna historia. Ale to już problem systemowy.

Czasy, gdy głos w telefonie automatycznie oznaczał konkretną osobę, bezpowrotnie minęły. I chyba powinniśmy zacząć się do tego dostosowywać, zanim zrobi to za nas ktoś z zupełnie innych pobudek.

Oceń artykuł

Średnia: 4.9 (10 ocen)

Kiedy głos w telefonie brzmi jak twoje dziecko, ale to nie ono

🗺️ Największy katalog firm AI w Polsce (467 firm)

Oracle wprowadza Gemini do Fusion Applications i NetSuite. 44 tysiące klientów, ale modele o generację starsze

Chatbot doradził kierowcy z Zabrza odmowę mandatu. Sąd orzekł 800 złotych zamiast 100

Claude opublikował złośliwy pakiet w PyPI. Anthropic potwierdza włamania do trzech organizacji podczas testów

Oracle wprowadza Gemini do Fusion Applications i NetSuite. 44 tysiące klientów, ale modele o generację starsze

Chatbot doradził kierowcy z Zabrza odmowę mandatu. Sąd orzekł 800 złotych zamiast 100

Claude opublikował złośliwy pakiet w PyPI. Anthropic potwierdza włamania do trzech organizacji podczas testów

OpenAI tnie ceny API. GPT-5.6 Luna kosztuje o 80 procent mniej, Terra o 20 procent

Jesteś z nami!

na skróty

Spotkajmy się

tematy

AI w praktyce

Najnowsze artykuły

Oracle wprowadza Gemini do Fusion Applications i NetSuite. 44 tysiące klientów, ale modele o generację starsze

Chatbot doradził kierowcy z Zabrza odmowę mandatu. Sąd orzekł 800 złotych zamiast 100

Claude opublikował złośliwy pakiet w PyPI. Anthropic potwierdza włamania do trzech organizacji podczas testów

OpenAI tnie ceny API. GPT-5.6 Luna kosztuje o 80 procent mniej, Terra o 20 procent

LinkedIn wprowadza przycisk „Seems like AI slop”. Pangram wyliczył, że 41 procent długich postów na platformie pisze sztuczna inteligencja

AIport.pl - o nas

Kiedy głos w telefonie brzmi jak twoje dziecko, ale to nie ono

Kluczowe fakty:

Trzy sekundy wystarczą

„Uprzemysłowione” oszustwa

Trzy sekundy i 35 milionów dolarów

Czy zawsze chodzi o deepfake?

Jak się bronić? Kilka konkretnych zasad

Prawo nie nadąża

Przeczytaj podobne artykuły:

Jesteś z nami!

na skróty

Spotkajmy się

tematy

AI w praktyce

Najnowsze artykuły

AIport.pl - o nas