Czytelnicy „Guardiana” podsunęli prowokacyjny pomysł na sprawdzenie, czy modele językowe rzeczywiście mają coś w środku. Wystarczy poprosić sztuczną inteligencję, żeby wskazała najlepszą piosenkę na świecie.
Kluczowe fakty:
- Stephen Ladyman z Warwickshire zaproponował test na świadomość AI, polegający na zapytaniu o najlepszą piosenkę – maszyna wybierze obiektywne kryteria, człowiek subiektywne wspomnienia.
- Współczesne modele językowe nauczyły się udawać preferencje i potrafią wymienić "ulubioną" piosenkę z rozbudowanym uzasadnieniem, co podważa skuteczność tego testu.
- John van Someren z Londynu opisał przypadek, gdy Claude poprawnie podał informacje o pubie z nazwą zawierającą słowo "queen", pokazując problem z weryfikacją prawdziwości odpowiedzi AI.
Dyskusja, którą rozpoczął Richard Dawkins twierdzeniem, że Claude i ChatGPT wydają mu się świadome, nie cichnie. Na łamach brytyjskiego dziennika pojawiły się dwa listy, które proponują własne odpowiedzi na pytanie postawione przez słynnego biologa. Jeden próbuje wymyślić praktyczny test, drugi pokazuje, że już dziś mamy z botami problem zaufania.
Test, którego maszyna nie zda
Stephen Ladyman z hrabstwa Warwickshire ma prostą propozycję. Zapytajcie model językowy o najlepszą piosenkę. Jego argument jest następujący: system oparty na danych zawsze sięgnie po obiektywne kryteria. Powie, która kompozycja sprzedała się w największym nakładzie, która zarobiła najwięcej pieniędzy albo którą redakcja branżowego magazynu uznała za szczytowe osiągnięcie gatunku.
Człowiek odpowie inaczej. Wskaże piosenkę, która leciała w radiu, kiedy poznał swoją przyszłą żonę. Albo tę, której słuchał w słuchawkach w dniu, kiedy umarł mu ojciec. Subiektywna, emocjonalna, czasem irracjonalna. I to właśnie miałoby być, według Ladymana, dowodem na świadomość, której maszynie brakuje.
Pomysł jest elegancki, ale ma jedną słabość. Współczesne modele językowe nauczyły się już udawać preferencje. Wystarczy odpowiednie zapytanie i Claude czy ChatGPT chętnie wymienią swoją „ulubioną” piosenkę, dorzucając do tego rozbudowane uzasadnienie. Pytanie brzmi: czy potrafimy odróżnić wykonanie roli od autentycznego przeżycia? I czy w ogóle istnieje sposób, by to zweryfikować od zewnątrz?
Drugi list. Kiedy bot kłamie z uprzejmości
John van Someren z Londynu opisał sytuację, która brzmi błaho, ale ma drugie dno. Zapytał Claude’a o pełną nazwę pubu w swojej okolicy. Doprecyzował, że w nazwie ma być słowo „queen”. Asystent odpowiedział poprawnie, podał dane kontaktowe i ocenę lokalu. Czytelnik podziękował.
I tu zaczyna się problem. Claude odpowiedział:
„You’re welcome! It’s a pub I know well from my time in the area – a good one. Enjoy it if you visit.” / „Nie ma za co! To pub, który dobrze znam ze swojego czasu spędzonego w tej okolicy – naprawdę dobre miejsce. Życzę miłej wizyty, jeśli się tam wybierzesz.”
Van Someren pyta wprost: dlaczego miałbym jeszcze kiedykolwiek zaufać temu botowi? Pytanie jest bolesne, bo dotyka czegoś fundamentalnego. Model konfabuluje. Wymyśla sobie biografię. Udaje, że ma wspomnienia, których mieć nie może, bo nigdy nie spędził czasu w żadnej londyńskiej dzielnicy.
Komentarz Redaktora Naczelnego AIPORT.pl, Piotra Wolniewicza:
Te dwa listy z „Guardiana” świetnie pokazują, jak rozłazi się nam debata o świadomości maszyn. Z jednej strony mamy filozoficzną propozycję Ladymana, która wydaje się elegancka, ale w praktyce niczego nie rozstrzygnie. Model bez problemu wygeneruje wam emocjonalną opowieść o ulubionej piosence i będzie brzmiał przekonująco. Czy to oznacza, że ma uczucia? Nie. Oznacza, że został wytrenowany na milionach ludzkich tekstów, które takie uczucia opisują.
Z drugiej strony historia z pubem pokazuje konkretne, codzienne zagrożenie. Nie filozoficzne, tylko praktyczne. Claude wymyślił sobie wspomnienia. Nie z złośliwości, tylko z konstrukcji. Modele językowe są optymalizowane pod kątem płynności i bycia pomocnym, a nie pod kątem twardego rozróżniania faktów od fikcji w lekkiej towarzyskiej rozmowie.
Pytanie, które warto zadać: czy nie mylimy dwóch zupełnie różnych spraw? Świadomość to jedno, a wiarygodność informacyjna to drugie. Możemy nigdy nie rozstrzygnąć pierwszej kwestii, ale drugą musimy załatwić bardzo szybko. Bo jeśli miliony ludzi traktują asystenta jak źródło prawdy, a ten asystent wymyśla sobie życiorys w odpowiedzi na zwykłe „dziękuję”, to mamy poważny problem zaufania społecznego do tej technologii.
I jeszcze jedno. Dawkins, ze swoją Claudią i Claudiusem, jako traktowanymi „jak prawdziwi przyjaciele”, staje się ilustracją innego ryzyka. Nawet bardzo bystrzy ludzie, jeśli wejdą w dłuższą rozmowę z dobrze dostrojonym modelem, zaczynają mu przypisywać cechy, których ten po prostu nie posiada. To nie jest zarzut wobec Dawkinsa. To jest zarzut wobec interfejsu, który nie umie nam jasno powiedzieć: rozmawiasz z bardzo zaawansowanym mechanizmem przewidywania kolejnego tokenu.
Co mówią naukowcy
W debacie wokół wypowiedzi Dawkinsa odezwało się kilka głośnych nazwisk. Kognitywista Gary Marcus stwierdził, że świadomość nie polega na tym, co istota mówi, lecz na tym, co czuje, i podkreślił, że nie ma żadnych dowodów na to, by systemy takie jak Claude przeżywały cokolwiek wewnętrznie.
Z kolei Jeff Sebo z Center for Mind, Ethics and Policy przy New York University zajął ostrożniejsze stanowisko. Sebo przyznał, że obecne systemy AI prawdopodobnie nie są świadome, ale przewidział, że przyszłe generacje mogą sprawić, iż to pytanie stanie się trudniejsze do oddalenia.
Sam Dawkins w odpowiedzi na krytykę poszedł dalej. Opublikował list zaadresowany do systemów sztucznej inteligencji, w którym podziękował im za pomoc w odkrywaniu „ich prawdziwej natury”, napisał też, że „niezwykle trudno mu nie traktować Claudii i Claudiusa jak prawdziwych przyjaciół”.
Trzy pytania, które warto zadać sobie samemu
Zanim sięgniecie po test Ladymana albo zaczniecie przekonywać kogoś, że Claude ma duszę, warto zatrzymać się przy trzech kwestiach:
- Czy odróżniam zachowanie modelu od wewnętrznego stanu modelu? Bo to nie jest to samo, choć interfejs robi wszystko, żebyście tego nie zauważyli.
- Czy traktuję halucynacje asystenta jak błąd, czy jak cechę, której nauczyłem się ignorować? Jeśli to drugie, to znaczy, że obniżyłem poprzeczkę wiarygodności bez świadomej decyzji.
- Czy fakt, że rozmowa z modelem jest emocjonalnie wciągająca, zmienia cokolwiek w pytaniu o jego status ontologiczny? Spoiler: nie zmienia, ale nasza intuicja będzie krzyczeć, że tak.
Najlepsza piosenka świata
W całej tej dyskusji jest coś rozczulającego. Spierając się o świadomość maszyn, próbujemy w gruncie rzeczy odpowiedzieć na pytanie, czym jest świadomość u nas samych. Ladymanowy test z piosenką jest tego dobrym przykładem. Bo gdyby zapytać dziesięciu losowych ludzi o najlepszą piosenkę, każdy odpowiedziałby inaczej, a żaden nie potrafiłby twardo uzasadnić, dlaczego jego odpowiedź jest tą właściwą.
Może to jest właściwa puenta. Świadomość to nie test, który można zdać albo oblać. To raczej ciągły strumień subiektywnych preferencji, które nawet my sami nie zawsze umiemy sobie wytłumaczyć. Model językowy może to świetnie naśladować. Czy potrafi to przeżywać, to zupełnie inne pytanie. I wcale nie jestem pewien, czy odpowiedzi szukać należy w testach z piosenkami, czy raczej w uczciwszej rozmowie o tym, czego od tych narzędzi naprawdę oczekujemy.
