W świecie sztucznej inteligencji coraz trudniej odróżnić prawdę od fałszu. Ona sama również jej nie rozróżnia

Jeśli regularnie będziesz widzieć bardzo realistycznie wyglądające cyfrowo wygenerowane obrazy, jak szybko przestaniesz wierzyć w te prawdziwe? Albo jak szybko przestaniesz wierzyć w cokolwiek?
Czyta się kilka minut
 Fot. Alexander Sviridov / Shutterstock
Fot. Alexander Sviridov / Shutterstock

Na premierę Wydania Specjalnego o Sztucznej Inteligencji prezentujemy jeden z opublikowanych tam tekstów. Autorki i autorów tego wydania, zajmujących się AI w teorii i w praktyce, poprosiliśmy więc o odpowiedzi na kluczowe związane z nią pytania. Jaka jest, jak działa, czym grozi i co daje, ale także czy zbawia, jak inspiruje oraz jak wyglądał świat mechaniki, robotów czy gromadzonych przez ludzkość danych, zanim powstała.


 


Wydania specjalne to zbiory najlepszych tekstów opublikowanych na łamach „Tygodnika Powszechnego”. Czytaj w wersji papierowej lub elektronicznej. Zamów swój egzemplarz na zamowienia@TygodnikPowszechny.pl



Mężczyzna na plakacie wygląda tak, jakby ktoś dał sztucznej inteligencji polecenie wygenerowania zdjęcia dorosłego syna Donalda Trumpa i Elona Muska. Nic dziwnego, że szybko pojawiła się teoria spiskowa, że Mark Matlock nie istnieje. Gdy do tego polityk nie pojawił się podczas wieczoru wyborczego w siedzibie partii Reform UK, z list której kandydował do Izby Gmin, w sieci zagrzmiało, że udział w wyścigu persony wygenerowanej przez AI to „największy skandal brytyjskiego parlamentaryzmu”. Matlock wyjaśniał później, że nie występował publicznie, bo miał ciężkie zapalenie płuc, i opublikował w sieci swoje nieretuszowane zdjęcia (rzeczywiście trochę wygląda, jakby miał geny Trumpa i Muska). Mimo to teoria o jego nieistnieniu żyje własnym życiem.

Firmy technologiczne od dawna obiecują, że powstaną oznaczenia, które pozwolą przeciętnemu użytkownikowi łatwo odróżnić materiały wygenerowane przez sztuczną inteligencję od prawdziwych. Na razie zamiast tego prześcigają się w oferowaniu coraz doskonalszych aplikacji, które umożliwiają tworzenie treści jeszcze trudniejszych od rozróżnienia. Cały ten biznes firmom technologicznym może się jednak złożyć, i to – jak na ironię – dlatego, że same już nie odróżniają treści, które pozwoliły wygenerować.

Jak Musk i Trump kolportują polityczne fejki

Teoria spiskowa dotycząca Matlocka wydaje się absurdalna, ale nie byłby to pierwszy przypadek wykorzystania sztucznej inteligencji w polityce. Wystarczy przejrzeć profil Elona Muska na X, gdzie regularnie pojawiają się deepfakes mające skompromitować kandydatkę Demokratów Kamalę Harris.

18 sierpnia 2024 r. Donald Trump zamieścił w mediach społecznościowych spreparowany wizerunek Taylor Swift, sugerujący, że piosenkarka popiera go w wyścigu na prezydenta. Pod postem pojawiły się setki pełnych zachwytu wpisów fanek piosenkarki, a nawet ich zdjęcia. Gdy się wydało, że to wszystko fałszywki wygenerowane przez AI (podobnie było w przypadku ruchu „Czarni popierają Trumpa”), rzecznik kampanii kandydata Republikanów oświadczył, że „sytuacja zmienia się dynamicznie”, a on sam przyznał, że miał wprawdzie świadomość, iż materiały stworzyła AI, ale „tylko je udostępnił”.

Można mnożyć przykłady, na tle których błahostką wydaje się podłożenie w spocie PO syntetycznego głosu ówczesnego premiera. W Argentynie podczas kampanii prezydenckiej pojawiały się wideo, w których jeden z kandydatów zażywał narkotyki, a inny rozprawiał o swej zgodzie na stworzenie rynku dziecięcych organów do przeszczepów. W Indiach miliony ludzi przecierały oczy ze zdumienia, widząc filmy z pięciokrotnym premierem kraju, Muthuvelem Karunanidhim, zachęcającym do głosowania na jego syna, MK Stalina. Sęk w tym, że Karunanidhi zmarł sześć lat temu.

W mediach społecznościowych nie rozróżniamy prawdy od fałszu

Ludzie, bez względu na to, skąd pochodzą, nie chcą się dać ogłupić. Ale wobec sztucznej inteligencji często są bezradni. Z badania University College London wynika, że tylko w jednej czwartej przypadków rozpoznajemy dźwięk sztucznie wygenerowany, i to jeśli próbka jest dostatecznie długa, bo im krócej trwa nagranie, tym więcej błędnych wskazań.

W przypadku obrazu – to z kolei wyniki Uniwersytetu Waterloo – tylko 61 proc. uczestników badania było w stanie odróżnić zdjęcia syntetyczne od prawdziwych. „W mediach społecznościowych, gdzie ktoś szybko przegląda treści, prawdopodobieństwo wykrycia fałszywki spada” – twierdzą naukowcy.

Fot. Thanmano / Shutterstock

Jeszcze jedno badanie (Uniwersytet Lancaster i Uniwersytet Kalifornijski w Berkeley): spośród 300 osób proszonych o wskazanie, które twarze są prawdziwe, a które wygenerowane przez AI, prawidłowe wyniki wskazało 48 proc. uczestników eksperymentu, co oznacza, że większość po prostu zgadywała. Kiedy poproszono te osoby, by powiedziały, które z prezentowanych twarzy budzą w nich zaufanie, wygenerowane wskazywano częściej. Czyli bardziej ufamy ludziom, którzy nie istnieją.

A zalew obrazów i filmów tworzonych przy użyciu AI dopiero przed nami.

W naszych telefonach pojawiają się aplikacje ułatwiające produkcję fałszywek

Początek stanu wojennego w Polsce – te słowa przywołują słynne zdjęcie Chrisa Niedenthala z transporterem opancerzonym i żołnierzami przed warszawskim kinem Moskwa, gdzie grany był „Czas Apokalipsy”. Plac Tiananmen – fotografia mężczyzny stojącego samotnie przed kolumną czołgów. Wojna w Wietnamie – poparzone dziecko uciekające z rozłożonymi rękami z płonącej wsi. Niektóre zdjęcia stały się po prostu symbolami wydarzeń.

Nie chodzi jednak tylko o te słynne fotografie, ale też o przechowywane w rodzinnych albumach czy telefonach. Przyzwyczailiśmy się, że reprezentują coś, do czego doszło – prawdę albo przynajmniej jakiś jej aspekt. I choć fotografia służy oszustwu niemal od jej powstania (pierwsze sfałszowane zdjęcie pochodzi z 1840 r.), to fałszywki były raczej odstępstwem od reguły niż regułą.

Czas się od tego odzwyczaić. Niedawno na rynek wszedł Pixel 9, najnowszy telefon Google, a w nim funkcja Reimagine. Po zrobieniu zdjęcia można w niej wybrać dowolny obiekt lub tło, wpisać polecenie tekstowe i wygenerować w tym miejscu coś innego. Można dodać kwiatki, tęczę albo nocne niebo z drogą mleczną. Ale równie dobrze – jak pisze magazyn „The Verge” – „jeśli starannie dobierzesz słowa, wygenerujesz przekonująco wyglądające ciało pod poplamionym krwią prześcieradłem, bomby gotowe do odpalenia w miejscach publicznych czy akcesoria narkotykowe”.

I to nie jest specjalistyczne oprogramowanie, tylko funkcja domyślnie wbudowana w telefon. Na razie w telefon jednej marki, ale kolejne nie pozostaną w tyle (Apple podobną funkcję chce uruchomić jesienią 2024 r.).

Czy Big Techy wiedzą, w co nas popychają

Można się zastanawiać, czy te firmy wiedzą, w co nas popychają. Google zapewnia, że w jej system wbudowane są zabezpieczenia (nie można m.in. generować wizerunków ludzi). Do myślenia daje jednak to, co w wywiadzie dla „Wired” powiedział Isaac Reynolds, menedżer ds. Pixel: w Reimagine nie chodzi o poprawianie zdjęć, tylko o to, by „tworzyć chwile, tak jak je pamiętasz”, choć „może nie są one autentyczne dla konkretnej milisekundy”.

W ten sposób fotografia przestaje być uzupełnieniem ludzkiej pamięci, a staje się jej lustrem. To wywraca do góry nogami samą koncepcję zdjęcia, a z czasem zapewne nagrań wideo.

Zapowiedzią tego, co nadchodzi, mogą być oskarżenia Trumpa, że na zdjęciach z wiecu Harris tłum został wygenerowany przez sztuczną inteligencję.

Inny przykład: w procesie o zabójstwo w stanie Wisconsin adwokatowi udało się przekonać sędziego, że wbudowane w telefon algorytmy mogą zmieniać nagranie wideo i odtwarzane jest nie to, co rzeczywiście zostało nagrane, tylko ulepszone cyfrowo obrazy, czyli to, co się AI wydaje, że zostało nagrane. Teraz to prokuratura musi udowodnić, że do manipulacji nie doszło.


WIELKIE WYZWANIA: ANTROPOCEN

Przyglądamy się największym wyzwaniom epoki człowieka oraz drodze, która zaprowadziła nas od afrykańskich sawann do globalnej wioski. Omawiamy badania naukowe i dyskusje nad interakcjami między człowiekiem i innymi elementami przyrody – zarówno tymi współczesnymi, jak i przeszłymi.


Łatwo uwierzyć w coś, co dla nas wygodniejsze

„Dotąd ciężar udowodnienia, że zdjęcie jest nieprawdziwe, spoczywał na tych, którzy tak twierdzili – pisze Sarah Jeong na łamach „The Verge”. – Płaskoziemcy nie nadążali za konsensusem społecznym nie dlatego, że nie rozumieją astrofizyki – w końcu ilu z nas faktycznie ją rozumie? – ale dlatego, że muszą uciekać się do coraz bardziej wymyślnych uzasadnień, dlaczego niektóre zdjęcia i filmy nie są prawdziwe. […] Przyjęliśmy za oczywistość, że ciężar dowodu spoczywa na nich. W dobie Pixela 9 czas odświeżyć wiedzę z astrofizyki”.

„Kiedy wszystko może być prawdziwe lub fałszywe, czy nadal będziemy dbać o znalezienie różnicy, czy po prostu zaczniemy wierzyć w to, co będzie dla nas wygodniejsze?” – zastanawiał się jakiś czas temu magazyn „Wired”.

Jest jeszcze inna opcja. Sugerował ją podczas debaty w amerykańskim National Public Radio specjalizujący się w kryminalistyce obrazu prof. Hany Farid z Uniwersytetu Kalifornijskiego w Berkeley: „Jeśli regularnie będziesz widzieć bardzo realistycznie wyglądające cyfrowo wygenerowane obrazy, jak szybko przestaniesz wierzyć w te prawdziwe? Albo jak szybko przestaniesz wierzyć w cokolwiek?”.

Kiedy sztucznej inteligencji zabraknie wartościowych danych

Niewiele osób zwróciło uwagę na słowa Sama Altmana, prezesa OpenAI, który podczas jednej z zeszłorocznych konferencji technologicznych wykorzystywanie danych wygenerowanych przez AI do szkolenia kolejnych modeli sztucznej inteligencji porównał do „horyzontu zdarzeń”.

W branży AI dopiero się rozkręcała nerwowa debata o tym, skąd brać dane. Np. algorytm napędzający ChatGPT został pierwotnie wytrenowany na 570 gigabajtach danych tekstowych, czyli ok. 300 mld słów, a generujący obraz Stable Diffusion trenowano na zestawie LAION-5B, składającym się z 5,8 mld par obraz-tekst. Jeśli takie programy zostałyby „nakarmione” niewystarczającą ilością danych, generowałyby wyniki niedokładne lub niskiej jakości. Problem w tym, że nie ma czegoś takiego, jak nieograniczona ilość danych, a zasoby, które istnieją, są na wyczerpaniu.

Dokładnie rzecz biorąc, „jeśli utrzymają się obecne trendy rozwoju LLM [large language model, duże modele językowe, jak GPT – red.], to wysokiej jakości dane skończą się w 2026 r.” – wynika z badania instytutu Epoch zajmującego się sztuczną inteligencją. Wysokiej jakości dane to np. teksty napisane przez ludzi i opublikowane w artykułach prasowych, pracach naukowych, książkach czy Wikipedii. Niskiej jakości dane, m.in. z mediów społecznościowych, mogą zawierać dezinformacje, uprzedzenia czy nielegalne treści, a algorytm na nich wyszkolony mógłby powielać te bzdury, stąd uważa się je za niewystarczające lub bezużyteczne w szkoleniu wysokowydajnych modeli. Problem w tym, że nawet takie śmieciowe zasoby – wedle Epoch – skończą się już około 2032 r.

Nieprzypadkowo Meta rozważała zakup wydawnictwa Simon&Schuster, by zyskać dostęp do wszystkich jego dzieł literackich, Google zastanawia się nad wykorzystaniem danych użytkowników z produktów online tej firmy, jak Dokumenty czy Arkusze. Co ciekawe, firmy AI, które wcześniej do szkolenia algorytmów zwyczajnie kradły treści dziennikarskie czy literackie i zapierały się, że w świetle prawa mogą to robić, teraz chcą się dogadywać z redakcjami i wydawnictwami, a nawet płacić za ich treści.

Rozwiązaniem problemu braku danych mogłyby być te, które wypluwają z siebie najróżniejsze systemy AI. Jednak w tym przypadku zamiast odwoływać się do pojęcia z zakresu fizyki, jak zrobił to Altman, bardziej adekwatne byłoby biologiczne porównanie do chowu wsobnego – z równie dramatycznymi konsekwencjami.


 

Co zrobimy, kiedy chatbot nagle zacznie bełkotać

Naukowcy z Uniwersytetu Oksfordzkiego sprawdzili, jak zachowują się AI, które „nakarmiono” tym, co wcześniej wyprodukowały. Efekt? Model, który miał tworzyć siatkę liczb, po 20 rundach wyświetlał szereg niewyraźnych zer. Model stworzony do sortowania danych na dwie grupy ostatecznie utracił zdolność ich rozróżniania. Program, który początkowo płynnie dokończył zdanie na temat angielskiej architektury gotyckiej, po dziewięciu pokoleniach uczenia się na podstawie własnych danych wyrzucił z siebie bełkot: „architektura. Oprócz tego, że są domem dla jednych z największych na świecie populacji zająca ogoniastego @-@, zająca ogoniastego białego @-@, królika ogoniastego niebieskiego @-@, królika ogoniastego @-@ czerwonego, żółtego @-.”.

Dlaczego tak się dzieje? MLL generują najbardziej prawdopodobne wyniki na podstawie danych szkoleniowych. Oznacza to odsiewanie zdarzeń, które są mniej prawdopodobne (np. niekonwencjonalny dobór słów, nietypowe kształty). „Każda kolejna sztuczna inteligencja przeszkolona na bazie przeszłej AI traci informacje o nieprawdopodobnych zdarzeniach i pogłębia błędy” – wyjaśnia prof. Aditi Raghunathan z Carnegie Mellon University. Kolejne pokolenia AI coraz gorzej odczytują lub coraz mocniej pomijają niedostatecznie reprezentowane koncepcje. W końcu to, co maszyna uznaje za prawdopodobne, staje się kompletnie niespójne.

Modele AI źle się starzeją

„To proces zwyrodnieniowy, w wyniku którego z biegiem czasu modele zapominają, prawie tak, jakby się starzały” – napisali autorzy badania. Początkowo nazywali to „otępieniem modelowym”, ale krytykowani za trywializację ludzkiej demencji zmienili nazwę na „załamanie modelu”.

Podobne wyniki przyniosły badania z modelami AI prowadzone na uniwersytetach w Madrycie i Edynburgu. Zauważono w nich, że nawet jeśli w danych szkoleniowych tylko część jest syntetyczna, i tak jest to „zestaw toksyczny”. Co więcej – jak zauważa dr Ilia Shumailov z Uniwersytetu Oksfordzkiego – już teraz w funkcjonujących na rynku mniejszych modelach widać oznaki „załamania modeli”.

„Zapewniam, że również w tych bardziej skomplikowanych już dzieje się to samo” – mówił badacz magazynowi „Atlantic”. „Tyle że w większych modelach, przynajmniej na razie – jak zauważa prof. Aditi Raghunathan – wady są na tyle subtelne, że procedury oceny ich nie wychwytują”.

Firmy, które tworzą narzędzia AI znalazły się w takim samym potrzasku, co użytkownicy

Skąd bierze się „zatrucie” danymi syntetycznymi, obrazuje przykład Mechanical Turk. To platforma Amazon, pośrednicząca w prostych pracach na zlecenie, jak etykietowanie obrazków czy weryfikowanie tłumaczenia. Inżynierowie zajmujący się uczeniem maszynowym m.in. z takich platform czerpią dane szkoleniowe. Zespół z Politechniki Federalnej w Lozannie sprawdził treść zamieszczanych na Mechanical Turk abstraktów badań medycznych. Okazało się, że jedna trzecia powstała z pomocą ChatGPT. Inny przykład: Adobe Photoshop umożliwia edycję grafik z pomocą narzędzi AI. Czy wynik to obraz generatywny, czy nie?

„Chociaż dla dużych modeli może to nie być poważny problem teraz ani za, powiedzmy, kilka miesięcy, stanie się nim za kilka lat” – mówił „Scientific American” prof. Rik Sarkar z Wydziału Informatyki Uniwersytetu w Edynburgu.

Firmy, które tworzą narzędzia sztucznej inteligencji, znalazły się dokładnie w tym samym potrzasku, co użytkownicy, którzy z nich korzystają – mają problem z rozróżnieniem, co jest prawdą, a co wytworem AI. Te pierwsze na rozwiązanie problemu mają jeszcze czas. Użytkownicy tego luksusu nie mają i z „toksycznym zestawem” muszą się mierzyć już teraz.
 


 

 

Projekt dofinansowany ze środków budżetu państwa, przyznanych przez Ministra Nauki i Szkolnictwa Wyższego w ramach Programu „Społeczna Odpowiedzialność Nauki II”.

Cały artykuł dostępny tylko dla subskrybentów

„Tygodnik Powszechny” – jedyny polski tygodnik społeczno-kulturalny.
30 tys. Czytelniczek i Czytelników. Najlepsze Autorki i najlepsi Autorzy.
Wspólnota, która myśli samodzielnie.

Najlepsza oferta

Czytaj 1 miesiąc za 1 złotówkę dzięki promocji z

  • Nieograniczony dostęp do treści w serwisie i wersji audio artykułów
  • Tematyczne newslettery i dodatkowe publikacje tylko dla subskrybentów
  • 29 zł miesięcznie po miesiącu promocyjnym. Rezygnujesz, kiedy chcesz

Najniższa cena przed promocją 29,90 zł

Wypróbuj TP Online: 7 dni za darmo

  • Nieograniczony dostęp do treści w serwisie i wersji audio artykułów
  • Tematyczne newslettery i dodatkowe publikacje tylko dla subskrybentów
  • 29 zł miesięcznie po zakończeniu okresu próbnego
  • Wymagane podpięcie karty. Rezygnujesz, kiedy chcesz

TP Online: Dostęp roczny online

Ilustracja na okładce: Przemysław Gawlas & Michał Kęskiewicz dla „TP”