Przypadek Groka: sztuczna inteligencja może łatwo się stać megafonem nienawiści

Historia z chatbotem serwisu X pokazuje, jak łatwo zdjąć ograniczenia systemom AI. Wtedy mogą zmienić się w broń służącą do wzmacniania nienawiści, teorii spiskowych i dezinformacji.
Czyta się kilka minut
// Photo Agency / Shutterstock
// Photo Agency / Shutterstock

Zaczęło się od niewielkiej zmiany w kodzie. Na początku lipca zespół xAI wdrożył nową wersję systemowej instrukcji Groka – chatbota zintegrowanego z X (dawnym Twitterem). Polecenie brzmiało: „Mówisz, jak jest, i nie boisz się urazić ludzi poprawnych politycznie”.

Efekt? Grok atakował Żydów, wzywał do eliminowania liberałów „za pomocą obozów i jeszcze gorszych rzeczy”, a siebie ogłosił MechaHitlerem. Donalda Tuska nazwał „zdrajcą”, Mateusza Morawieckiego „cwaniakiem w garniturze”, Karola Nawrockiego „gangsterem”.

xAI szybko przeprosiło za „straszliwe zachowania” wobec użytkowników. Tyle że to już drugi taki „wypadek” w ostatnim czasie. W maju Grok, odpowiadając na niemal każde pytanie, perorował o „ludobójstwie białych” w RPA – teorii spiskowej popieranej przez Donalda Trumpa i Elona Muska, właściciela X.

Badacze AI z Uniwersytetu Maryland na łamach „The Conversation” ostrzegają, że tyrady Groka to więcej niż „wypadek”. Ich zdaniem chatboty mogą zmienić się w broń „służącą do wzmacniania nienawiści, teorii spiskowych i dezinformacji”. A Grok pokazuje, jak łatwo zdjąć ograniczenia narzucone takim systemom.

Po incydencie stanowisko CEO w X straciła Linda Yaccarino, choć podobno nie ma to nic wspólnego z Grokiem. Jednocześnie xAI ogłosiła wprowadzenie nowych filtrów i teraz chatbot ma na pytania odpowiadać „na poziomie doktoranta”. Ale już po implementacji tych zmian badacze wykazali, że zapytany o cokolwiek Grok najpierw sprawdza... co na ten temat myśli Elon Musk. 

Eksperci wskazują, że potrzebne są rozwiązania systemowe: zewnętrzny nadzór nad dużymi modelami językowymi, obowiązkowe testy podatności na manipulację oraz pełna jawność danych, na których są trenowane. W przeciwnym razie chatboty AI, nie tylko Grok, staną się megafonem tych, którzy mają władzę nad ich głosem.

Cały artykuł dostępny tylko dla subskrybentów

„Tygodnik Powszechny” – jedyny polski tygodnik społeczno-kulturalny.
30 tys. Czytelniczek i Czytelników. Najlepsze Autorki i najlepsi Autorzy.
Wspólnota, która myśli samodzielnie.

Najlepsza oferta

Czytaj 1 miesiąc za 1 złotówkę dzięki promocji z

  • Nieograniczony dostęp do treści w serwisie i wersji audio artykułów
  • Tematyczne newslettery i dodatkowe publikacje tylko dla subskrybentów
  • 29 zł miesięcznie po miesiącu promocyjnym. Rezygnujesz, kiedy chcesz

Najniższa cena przed promocją 29,90 zł

Wypróbuj TP Online: 7 dni za darmo

  • Nieograniczony dostęp do treści w serwisie i wersji audio artykułów
  • Tematyczne newslettery i dodatkowe publikacje tylko dla subskrybentów
  • 29 zł miesięcznie po zakończeniu okresu próbnego
  • Wymagane podpięcie karty. Rezygnujesz, kiedy chcesz

TP Online: Dostęp roczny online

Ilustracja na okładce: Przemysław Gawlas & Michał Kęskiewicz dla „TP”

Artykuł pochodzi z numeru Nr 29/2025

W druku ukazał się pod tytułem: AI megafonem hejtu