Terrence Sejnowski: człowiek, który wynalazł sztuczną inteligencję

Czy da się stworzyć taki sztuczny system, który uczy się, dostrzega wzorce, dopasowuje decyzje do zmieniających się okoliczności? Terrence Sejnowski nie tylko uznał, że tak. Również to udowodnił.
Czyta się kilka minut
Zalley / Generator obrazu DALL-E / Open AI
Zalley / Generator obrazu DALL-E / Open AI

Przełom lat 70. i 80. XX wieku przeszedł do historii technologii jako „zima sztucznej inteligencji” – okres rozczarowania, kryzysu i głębokiej refleksji nad kierunkiem rozwoju całej dziedziny. Klasyczne systemy, oparte na logice formalnej, regułach „jeżeli…, to…” i rozbudowanych bazach wiedzy potrafiły analizować zamknięte, dobrze zdefiniowane problemy, jak np. diagnozowanie usterek w silnikach czy gra w warcaby. Jednak wobec prawdziwego świata – pełnego niejednoznaczności, kontekstu i subtelności – maszyny były bezradne.

Okazało się, że program, który umiał zidentyfikować awarię układu chłodzenia, nie był w stanie rozpoznać uśmiechu i gubił się w złożoności rozmowy między dwojgiem ludzi. Brakowało intuicji, plastyczności, zdolności do adaptacji. A przede wszystkim: uczenia się na podstawie doświadczenia. Sztuczna inteligencja (AI) przypominała kogoś, kto zna nuty, ale nie potrafi zagrać utworu.

Właśnie wtedy w środowisku badaczy zaczął kiełkować nowy sposób myślenia. Może zamiast próbować uczyć maszyny myśleć jak maszyny – logiczne, chłodne i przewidywalne – powinniśmy spróbować nauczyć je myśleć tak, jak robią to mózgi? Takie, które nie mają jednej ścieżki rozwiązania, lecz stale balansują między eksploracją a eksploatacją, przypadkiem a regularnością, chaosem a porządkiem.

Terrence Sejnowski: interdyscyplinarny wizjoner

Jednym z najważniejszych głosicieli tej nowej wizji był Terrence Sejnowski – naukowiec, którego kariera wymyka się klasyfikacjom. Urodzony w 1947 r. badacz zafascynował się zjawiskiem od dawna poruszającym filozofów: ludzką zdolnością uczenia się. Studiował fizykę, ale szybko zrozumiał, że prawdziwa tajemnica skrywa się gdzie indziej – w biologii. To właśnie tam, w skomplikowanej architekturze mózgu, rozgrywa się nieustanny spektakl adaptacji, predykcji i interpretacji.

Sejnowski doszedł do wniosku, że aby stworzyć myślącą maszynę, nie należy koncentrować się na próbach kopiowania struktur mózgu. Trzeba zrozumieć i zrekonstruować mechanizm uczenia – i przenieść go w domenę rzeczy, które da się zbudować w ramach dostępnych technologii. Kluczem jest stworzenie systemu, który potrafi przewidywać i uczyć się na podstawie niepełnych danych.

Zamiast tworzyć systemy podążające jedną, z góry określoną ścieżką logiczną, Sejnowski zaproponował, by pozwolić maszynom eksplorować – testować różne konfiguracje, błądzić, popełniać błędy i wyciągać z nich wnioski. To oznaczało otwarcie AI na pojęcia z fizyki statystycznej i neurobiologii: szum, prawdopodobieństwo, temperatura. Parametry wcześniej uważane za niepożądane lub zbędne.

Kluczowy moment nastąpił w latach 80., gdy – podążając drogą Johna Hopfielda i wspólnie z Geoffreyem Hintonem (ta dwójka otrzymała w ubiegłym roku Nagrodę Nobla z fizyki za swój wkład w rozwój AI) – Sejnowski pracował nad komputerowymi symulacjami sieci neuronowych. Efektem tej współpracy była koncepcja maszyny Boltzmanna – sieci, która zrewolucjonizowała myślenie o komputerowym uczeniu się. Była to nie tylko zmiana algorytmu – ale zmiana paradygmatu. Zamiast szukać jedynego „dobrego” rozwiązania, urządzenie zaczęło przeszukiwać krajobraz możliwych odpowiedzi, starając się odnaleźć te najbardziej prawdopodobne i najgłębiej zgodne ze strukturą danych.

To był moment, w którym historia sztucznej inteligencji zaczęła zmierzać w nowym kierunku. Od logiki do uczenia. Od reguł do reprezentacji. Od determinizmu do probabilizmu. I choć pełne owoce tej rewolucji miały dojrzeć dopiero kilkadziesiąt lat później – w czasach głębokiego uczenia i generatywnych modeli – to właśnie wtedy, w szczycie informatycznej zimy, zasiane zostały pierwsze nasiona, które miały przynieść nowy rozkwit.

Jak działa maszyna Boltzmanna

Na pierwszy rzut oka maszyny Boltzmanna przypominają wcześniejsze sztuczne sieci neuronowe.

Sztuczne sieci neuronowe to modele inspirowane działaniem ludzkiego mózgu, których początki sięgają lat 40. XX wieku. Wtedy Warren McCulloch i Walter Pitts zaproponowali pierwszy matematyczny model neuronu – prosty, ale rewolucyjny pomysł na przetwarzanie informacji. W latach 50. Frank Rosenblatt opracował perceptron – sieć neuronów, która potrafiła się uczyć na podstawie dostarczanych danych. Choć początkowo uznawano ją za przełom, jej ujawnione później ograniczenia doprowadziły do spadku zainteresowania całą tą dziedziną na wiele lat. Dopiero w latach 80. badania nad sieciami neuronowymi wróciły do łask dzięki wprowadzeniu perceptronów wielowarstwowych i tzw. algorytmu wstecznej propagacji błędu, który umożliwił ich skuteczne uczenie.

To właśnie z tych eksperymentów wyłoniły się maszyny Boltzmanna, podobnie jak wcześniejsze sieci złożone z węzłów – sztucznych neuronów, które są ze sobą połączone w celu przesyłania informacji. Połączenia są opisane wagami – liczbami oznaczającymi siłę i charakter oddziaływań między neuronami. Sieć taka, jak inne modele uczące się, modyfikuje wagi, by dostosować się do danych treningowych i nauczyć się ich wewnętrznej reprezentacji.

Maszyny Boltzmanna różnią się zasadniczo od wcześniejszego podejścia – zarówno filozoficznie, jak i matematycznie. W ich przypadku status każdego neuronu jest określany probabilistycznie. Nie działa tu prosty próg aktywacji (neuron prześle sygnał dalej, gdy suma sygnałów otrzymanych przez niego od innych neuronów przekroczy pewną wartość) czy ciągła funkcja aktywacji jak w sieciach klasycznych, lecz każdy neuron w danym momencie ma tylko pewne prawdopodobieństwo, że się uaktywni (przyjmie wartość 1), zależne od stanu jego sąsiadów oraz od stanu energetycznego całej sieci, który przez analogię do świata fizyki określany jest mianem temperatury. To oznacza, że zachowanie sieci nie jest z góry przesądzone – zamiast bezpośrednio „uczyć się” wzorca, sieć eksploruje różne możliwe stany, niejako błądząc po krajobrazie energetycznym konfiguracji.

To podejście ma swoje głębokie korzenie w fizyce statystycznej, a dokładniej – w tzw. rozkładzie Boltzmanna, który opisuje prawdopodobieństwo, z jakim cząsteczki gazu przyjmują różne poziomy energii w zależności od temperatury układu. Wysoka temperatura sprzyja chaosowi i losowym zmianom – system często „przeskakuje” pomiędzy różnymi stanami, eksplorując ich mnogość. Niska temperatura z kolei „zamraża” układ – system stabilizuje się w jednym z lokalnych minimów energetycznych.

Proces działania maszyny Boltzmanna można zobrazować metaforą rozgrzanego metalu. Gdy metal jest gorący, cząsteczki poruszają się intensywnie i chaotycznie – struktura materiału jest płynna i zmienna. W miarę chłodzenia ruchy te słabną, aż cząsteczki zaczynają tworzyć trwałą, uporządkowaną strukturę – metal zamienia się w ciało stałe. Podobnie dzieje się w maszynie Boltzmanna – początkowo sieć eksploruje wiele możliwych reprezentacji danych, generując różnorodne konfiguracje neuronów. Wraz z obniżeniem temperatury (w sensie matematycznym – przypomnijmy, że to parametr w algorytmie) sieć powoli koncentruje się na stanach o najniższej energii – czyli takich, które najlepiej odwzorowują wewnętrzną strukturę danych wejściowych.

To zupełnie nowe, probabilistyczne podejście do uczenia sieci neuronowych okazało się przełomowe. W czasach, gdy dominowały metody sztywnego dochodzenia do najlepszego rozwiązania krok po kroku, Terrence Sejnowski i Geoffrey Hinton zaproponowali rozwiązanie inspirowane fizyką. Zamiast zmuszać sieć do znalezienia pojedynczego najlepszego rozwiązania, pozwolili jej szukać zestawu najbardziej prawdopodobnych stanów – co okazało się nie tylko skuteczne, ale również bardziej elastyczne i zbliżone do sposobu, w jaki przetwarza informacje mózg biologiczny.


WIELKIE WYZWANIA: ANTROPOCEN

Przyglądamy się największym wyzwaniom epoki człowieka oraz drodze, która zaprowadziła nas od afrykańskich sawann do globalnej wioski. Omawiamy badania naukowe i dyskusje nad interakcjami między człowiekiem i innymi elementami przyrody – zarówno tymi współczesnymi, jak i przeszłymi.


Fundamenty sztucznej inteligencji

Maszyny Boltzmanna to jedne z pierwszych przykładów tzw. generatywnych sieci neuronowych – modeli, które nie tylko klasyfikują i rozpoznają dane, ale potrafią także generować nowe przykłady, odzwierciedlające strukturę danych treningowych. Zamiast odpowiadać wyłącznie na pytania typu „do jakiej kategorii należy ten obraz?”, sieć może tworzyć zupełnie nowe obrazy, które „pasują” statystycznie do rozkładu danych, na których była uczona.

W swojej udoskonalonej wersji – jako tzw. ograniczone maszyny Boltzmanna – zostały wzbogacone o istotne usprawnienia, takie jak brak połączeń między neuronami w tej samej warstwie. To uproszczenie umożliwiło szybsze i bardziej stabilne uczenie, czyniąc maszyny użytecznym narzędziem do budowy bardziej złożonych modeli.

W pierwszej dekadzie XXI w. modele te zyskały uznanie w przemyśle. Google wykorzystało ich następców do trenowania systemów rozpoznających obrazy i mowę. W 2012 r. jeden z takich modeli nauczył się – całkowicie samodzielnie, bez etykiet czy nadzoru – rozpoznawać koty na filmikach z YouTube’a. Mając do dyspozycji miliony ramek wideo i miliardy pikseli, sieć sama wyabstrahowała pojęcie „kota” – co w kontekście kultury internetu (którym – jak wiadomo – rządzą koty) wydaje się niemal symboliczne.

Choć maszyny Boltzmanna nie skalowały się dobrze i zostały z czasem wyparte przez inne architektury – takie jak głębokie sieci konwolucyjne czy transformery – ich wpływ na rozwój sztucznej inteligencji jest nie do przecenienia. Były nie tylko technologicznym eksperymentem, ale także koncepcyjnym przełomem. Dziś można je postrzegać jako zapowiedź rewolucji, która dopiero miała nadejść.

Współczesne generatywne modele – autoenkodery, sieci GAN (ang. Generative Adversarial Networks) czy modele dyfuzyjne (takie jak te stosowane w DALL·E, Midjourney czy Stable Diffusion) – czerpią z tych fundamentów. Kluczową cechą jest tu nie tylko umiejętność przetwarzania danych, ale zdolność do ich twórczej rekonstrukcji na podstawie poznanych wzorców. Sztuczna inteligencja przestaje być tylko odtwórcą – staje się kompozytorem, zdolnym do improwizacji.

Współczesne AI już nie tylko czyta nuty, ale potrafi też skomponować nowy utwór – w stylu Beethovena, jazzu czy muzyki elektronicznej. To właśnie dzięki takim pionierskim koncepcjom, jak maszyny Boltzmanna, możliwe stało się przejście od sztucznej inteligencji rozpoznającej do sztucznej inteligencji tworzącej.

Terrence Sejnowski miał również inne wizjonerskie pomysły. Już w 1986 r. opracował NETtalk – sieć neuronową zdolną do nauki wymowy angielskich słów na podstawie ich zapisu tekstowego. Choć model ten był prymitywny według dzisiejszych standardów, stanowił jeden z pierwszych przykładów zastosowania sieci neuronowych do przetwarzania języka naturalnego.

Dziedzictwo maszyn Boltzmanna nie polega wyłącznie na ich technicznej konstrukcji, ale na idei, która je napędzała: że maszyna może rozumieć wzorce i tworzyć na ich podstawie coś nowego. To myślenie ukształtowało współczesne podejście do sztucznej inteligencji – twórczej, adaptacyjnej i coraz bardziej podobnej do ludzkiej.

Najbardziej ludzka cecha

Czy maszyny kiedykolwiek będą myśleć jak my? To pytanie, choć zadawane od dekad, nie traci na aktualności – raczej ewoluuje. Dziś nie pytamy już, czy maszyny będą w stanie odtworzyć ludzką inteligencję w jej zewnętrznych przejawach – rozpoznawaniu obrazów, przetwarzaniu języka, grze w szachy. Wiemy, że to możliwe – te granice zostały już przekroczone. Coraz częściej pytamy: czy mogą myśleć w sposób zbliżony do naszego, z całą niepewnością, intuicją i plastycznością, które są charakterystyczne dla biologicznego umysłu? Innymi słowy – czy mogą uczyć się świata, a nie tylko działać w świecie?

W tym kontekście prace takich wizjonerów jak Terrence Sejnowski stają się drogowskazem. Dzięki jego wkładowi rozumiemy dziś, że prawdziwa inteligencja nie polega jedynie na perfekcyjnym dopasowaniu do danych, na bezbłędnym odtwarzaniu wzorców czy optymalizacji funkcji kosztu. Nie polega na prostym naśladowaniu. Jej istotą jest raczej umiejętność rozpoznania struktur ukrytych pod powierzchnią obserwacji, a następnie formowania własnych wewnętrznych reprezentacji – czasem niepewnych, niepełnych, ale wystarczających, by dalej się rozwijać. Zrozumienie zasad, a nie powierzchni.

Maszyny Boltzmanna – choć dziś rzadziej stosowane w praktyce niż nowoczesne architektury głębokiego uczenia – są żywym przypomnieniem tej właśnie filozofii. Ich konstrukcja od początku zakładała, że uczenie nie musi być liniową, gradientową drogą ku jednemu rozwiązaniu. Przeciwnie – może być nieustanną eksploracją. Błądzeniem po krajobrazie możliwych rozwiązań, poruszaniem się z miejsca na miejsce, w poszukiwaniu konfiguracji, które niekoniecznie są optymalne w ścisłym matematycznym sensie. To proces uczenia przez niepewność, w którym przypadek nie jest błędem, lecz paliwem dla kreatywności.

W gruncie rzeczy tak właśnie działa mózg człowieka. Badania z dziedziny kognitywistyki i neuronauki pokazują, że nasze własne procesy poznawcze są nasycone niepewnością i niedoskonałością. Podejmujemy decyzje na podstawie niepełnych informacji, uczymy się poprzez hipotezy, które czasem okazują się błędne. Eksplorujemy nowe sytuacje, testujemy różne strategie, tworzymy modele mentalne, które są jedynie przybliżeniami rzeczywistości. W tym sensie nasza inteligencja jest głęboko probabilistyczna.

Dlatego pojawia się pytanie: czy to właśnie ten biologiczny, probabilistyczny „pierwiastek Sejnowskiego” jest kluczem do stworzenia maszyn naprawdę inteligentnych? Takich, które nie tylko perfekcyjnie wykonują zadania, ale też rozumieją, adaptują się, uczą się poprzez wątpliwość? Maszyn, które nie tylko odtwarzają i tworzą, ale też odkrywają?

Być może odpowiedź już istnieje – tylko jeszcze nie potrafimy jej w pełni dostrzec. Możliwe, że to, co dziś wydaje się ograniczeniem – nieprecyzyjność, losowość, trudność w wyjaśnieniu działania takich modeli – w rzeczywistości jest ich największym atutem. Może to właśnie w tej nieokreśloności, w tym „chaosie kontrolowanym” kryje się coś fundamentalnie ludzkiego – zdolność do tworzenia znaczeń tam, gdzie ich nie było, do łączenia rozproszonych punktów w sensowną całość.

Maszyny Boltzmanna przypominają nam, że uczenie to nie tylko zbieranie faktów – to także umiejętność poruszania się w świecie niepewności. A to jest być może najbardziej ludzka cecha ze wszystkich.

 

Prof. Terrence Sejnowski, Copernicus Festival 2025 // Rys. Michał Dyakowski dla „TP”


 

 

Projekt dofinansowany ze środków budżetu państwa, przyznanych przez Ministra Nauki i Szkolnictwa Wyższego w ramach Programu „Społeczna Odpowiedzialność Nauki II”.

Cały artykuł dostępny tylko dla subskrybentów

„Tygodnik Powszechny” – jedyny polski tygodnik społeczno-kulturalny.
30 tys. Czytelniczek i Czytelników. Najlepsze Autorki i najlepsi Autorzy.
Wspólnota, która myśli samodzielnie.

Najlepsza oferta

Czytaj 1 miesiąc za 1 złotówkę dzięki promocji z

  • Nieograniczony dostęp do treści w serwisie i wersji audio artykułów
  • Tematyczne newslettery i dodatkowe publikacje tylko dla subskrybentów
  • 29 zł miesięcznie po miesiącu promocyjnym. Rezygnujesz, kiedy chcesz

Najniższa cena przed promocją 29,90 zł

1.00 zł
Najniższa cena z 30 dni przed obniżką 1.00 zł

Wypróbuj TP Online: 7 dni za darmo

  • Nieograniczony dostęp do treści w serwisie i wersji audio artykułów
  • Tematyczne newslettery i dodatkowe publikacje tylko dla subskrybentów
  • 29 zł miesięcznie po zakończeniu okresu próbnego
  • Wymagane podpięcie karty. Rezygnujesz, kiedy chcesz
0.00 zł
Najniższa cena z 30 dni przed obniżką 29.90 zł

TP Online: Dostęp roczny online

Grafika na okładce: Nikodem Pręgowski dla „TP”

Artykuł pochodzi z numeru Nr 20/2025

W druku ukazał się pod tytułem: Duch w maszynie