Prof. Michał Kosiński jest psychologiem społecznym i data scientist z Uniwersytetu Stanforda. Od lat zajmuje się tym, jak ludzie i technologie wzajemnie na siebie wpływają, oraz badaniem ludzi poprzez pozostawiane przez nich cyfrowe ślady. Jeden z czołowych specjalistów w dziedzinie psychometrii. W 2013 r. opublikował badania pokazujące dokładność algorytmów, zdolnych do trafnego oszacowania portretu psychologicznego człowieka, włącznie z jego intymnymi cechami, na podstawie już kilkudziesięciu jego polubień na Facebooku. Przestrzegał przed zagrożeniem, jakie tego rodzaju algorytmy stwarzają dla prywatności. Niedługo później okazało się, jak z wykorzystaniem możliwości tych algorytmów manipulowano np. wyborami w USA czy kampanią brexitu.

Przyglądamy się największym wyzwaniom epoki człowieka oraz drodze, która zaprowadziła nas od afrykańskich sawann do globalnej wioski. Omawiamy badania naukowe i dyskusje nad interakcjami między człowiekiem i innymi elementami przyrody – zarówno tymi współczesnymi, jak i przeszłymi.
Pełna transkrypcja rozmowy
Poniższy tekst powstał w oparciu o transkrypcję maszynową, może zawierać usterki językowe.
WOJCIECH BRZEZIŃSKI: Właśnie opublikowałeś, niedawno opublikowałeś pracę, która na pierwszy rzut oka wydaje się zupełnie sensacyjna. Napisałeś, że chatboty, takie jak Chat GPT dysponują czymś, co wydawało się być tylko właściwością umysłów i to nie wszystkich, ludzkich na pewno. Czymś, co nazywamy teorią umysłów. Co to właściwie oznacza?
PROF. MICHAŁ KOSIŃSKI: Teoria umysłu to jest taka unikalna zdolność do tego, aby myśleć nie tylko za siebie, ale automatycznie, instynktownie i natychmiastowo myśleć także za innych. I każdy z nas doświadcza, czy używa tę umiejętność wiele razy dziennie. Wyobraźmy sobie sytuację, gdy siedzimy razem w pokoju, czy tutaj właśnie nagrywamy ten podcast i nagle ktoś do tego pokoju wchodzi. My wiemy, o czym rozmawiamy. My wiemy, co zdarzyło się w tym pokoju kilka minut temu, ale my automatycznie od razu wiemy też, że ta osoba, która tylko teraz do nas dołączyła, nie będzie miała tej wiedzy. Wydaje się to nam wszystkim bardzo proste. Oczywiście, ta osoba nowa tego nie wie, bo tutaj dopiero przyszła. Ale zwróćcie uwagę, żeby mieć, przewidzieć to, że ta osoba nie będzie wiedziała, co zdarzyło się w pokoju, trzeba automatycznie wziąć perspektywy tej osoby i zrozumieć, że my mamy pewne informacje, my mamy pewną wiedzę, której ta osoba nie ma. I wydaje się nam się to tak proste, dlatego iż ludzie automatycznie przetwarzają informacje w taki sposób. I żeby zrozumieć czy dostrzec, jak wyjątkowa i trudna jest ta umiejętność, należy sobie uświadomić, że dzieci dopiero w wieku około 10 czy 11 lat potrafią automatycznie takie rozumowanie przeprowadzić. Inne bardzo mądre zwierzęta, takie jak delfiny, szympansy, słonie, które są społeczne, które bardzo dobrze sobie radzą w naturze i w swoich interakcjach, też nie potrafią automatycznie takich zadań rozwiązać. Jeżeli jeden szympans coś wie, to ten szympans zakłada, że inne szympansy też to wiedzą. Nie potrafi ten szympans zrozumieć, że są różne punkty widzenia i różne zasoby informacji.
Dobra, ale co to oznacza? Czy to oznacza, że chatboty myślą?
No właśnie, to zależy od tego, jak zdefiniujemy myślenie. W moim mniemaniu myślenie to jest aktywność siatek neuronowych. My ludzie mamy, nasze mózgi oparte są na siatkach neuronowych i naszą aktywność tych siatek neuronowych nazywamy myśleniem i przez wiele dziesięcioleci upieraliśmy się, że to co maszyny robią,
to myśleniem być nie może, bo przecież my je programujemy, my je projektujemy, my tłumaczymy maszynom, jak osiągnąć zadanie, dla którego ta maszyna została stworzona. I dlatego zawsze upieraliśmy się, że to co ludzie robią w głowach, to myślenie,a to co komputery czy inne maszyny robią, to jest tylko wykonywanie poleceń czy jakiś procedur. I wydaje mi się, że w tej erze siatek neuronowych, w tej nowoczesnej sztucznej inteligencji, która oparta jest na architekturze, która jest bardzo podobna do tego co dzieje się w naszych głowach, myślę, że właściwym dzisiaj byłoby nazywaniem tych procesów myśleniem.
Bardzo mi się podoba takie określenie, które tutaj pasuje, szowinizm węglowy.
No właśnie, dodajmy do tego węgla trochę silikonu też. Zwróćmy uwagę na to, że wydaje mi się, że na koniec dnia to nie zależy tak bardzo od tego, czy ta nasza siatka neuronowa jest mokra, biologiczna, w głowie ludzkiej zawarta. Wyobrazić sobie można, że podobne siatki neuronowe, podobne do naszych, w innych urządzeniach, na przykład w chipsecie silikonowym, też mogą zajmować się myśleniem. I zwróćmy też uwagę na to, że te maszyny dzisiejsze, te sieci neuronowe są zupełnie inne od tych maszyn sprzed lat 10 czy 20. Tutaj taki przykład, który ja bardzo lubię, to przykład Deep Blue, tej maszyny IBM, która po raz pierwszy pokonała człowieka, arcymistrza w szachy, Garego Kasparowa. W 1996-1997 roku IBM Deep Blue przy użyciu swojej niesamowitej mocy obliczeniowej, przy użyciu tej mocy obliczeniowej, która była wykorzystywana do tego, że przewidywać miliony ruchów naprzód, pokonał Kasparowa. Korzystając także z wielkiej pamięci, z pamięci wszystkich archiwalnych gier rozegranych przez arcymistrzów, z pamięci wszystkich zakończeń, kiedy na planszy są tylko 5 czy 6 figur. I dokonała ta maszyna tego niesamowitego osiągnięcia, która wydawała się ekspertom ODI zupełnie niemożliwa. Dokonała właśnie dzięki tej swojej wielkiej mocy obliczeniowej.
I tutaj moja intuicja przynajmniej jest taka, że IBM Deep Blue nie myślał, IBM Deep Blue nie rozumiał, nie umiał grać w szachy. IBM Deep Blue wykorzystał trick, wykorzystał, po prostu zhakował tą grę i każdy z nas może tak zrobić do pewnego stopnia. Wyobraźmy sobie kółko i krzyżyk. Każdy z nas to grał w kółko i krzyżyk kilka razy. Nie musi wcale myśleć nad następnym ruchem. Wystarczy po prostu zasięgnąć w pamięci odpowiedzi. Pamięć nam od razu podpowie, posłuchaj, tutaj musisz postawić swoje kółko czy krzyżyk, żeby wygrać, żeby uniemożliwić wygraną drugiej stronie. Więc też można powiedzieć, że na początku, jak człowiek się uczy grać w kółko i krzyżyk, to myśli, rozumuje i stara się tą grę zrozumieć. A w pewnym momencie człowiek gra po prostu z pamięci, automatycznie, nie myśląc za dużo i wtedy też upierałbym się, że to nie jest myślenie już, tylko to jest po prostu trik, gdzie z pamięci te ruchy wyjmujemy. I teraz te właśnie ludzkie podejście do kółka i krzyżyk, czy ten IBM Deep Blue grający w szachy, no to jest takie właśnie maszynowe niemyślenie.
Ale sieci neuronowe działają zupełnie inaczej, zarówno u człowieka, jak i w tych maszynach. Sieci neuronowe uczą się same. Nikt nie tłumaczy sieciom neuronowym, jak używać języka, jak grać w szachy, jak grać w go, czy jak prowadzić samochód. Sieci te uczą się tego, tak samo jak ludzie,
na własnych próbach i błędach. I często w tym procesie nauki odkrywają sposoby gry w szachy, gry w go, odkrywają sposoby używania języka, czy odkrywają jak prowadzić ten samochód w sposób taki, w jaki człowiek nigdy tego języka, tych szachów, czy tego samochodu nie używał. Co dowodem jest na to, proszę Państwa, że te maszyny nie tylko nie po prostu za nami papugują, czy kopiują to, co ludzie robią wcześniej, to też do pewnego stopnia robią. Tak samo jak ludzie. Nawet najmądrzejsi ludzie.
Kasparow nie wymyślił gry w szachy sam z siebie i nie wymyślił wszystkich strategii szachowych sam. Wielu z nich się nauczył, skopiował je po prostu od innych. Ale potem metodą prób i błędów i wielkiego myślenia ten Kasparow popchnął tą strategię, tą wiedzę na temat gry w szachy do przodu, wykombinował nowe, kreatywne podejścia do gry w szachy.
I proszę Państwa, dokładnie to samo stosuje się do tych sztucznych siatek neuronowych, które na początku kopiują i sobie nas obserwują i starają się po nas papugować, ale potem biorą tę grę w szachy, czy w go, czy grę w język do następnego poziomu, który jest dla nas nieosiągany.
To jest trochę tak, że w przypadku przynajmniej tych popularnych chatbotów, tak, czy to Gemini, czy Cloda, czy ChatGPT, założenie było takie, że to miała być taka bardzo, bardzo duża wersja słownika z Nokii, autocomplete z Nokii, tak, czyli generalnie on miał po prostu wymyślać następne słowo w szeregu. Coś w zasadzie bardzo prostego. Okej, na większą skalę zamiast jednego słowa miałbym wymyślać cały tekst, ale ciągle w oparciu o statystykę. Skąd się tu bierze ta złożoność? Skąd tu bierze możliwość faktycznego myślenia?
Więc maszyny te, te z sieci neuronowej, ich zadanie jest bardzo proste. Zgadnąć następne słowo w ciągu słów. I faktycznie one nie zgadują nawet całych paragrafów. One zgadują po prostu jedno następne słowo, po czym biorą ten oryginalny tekst, plus to swoje jedno słowo i teraz zgadują słowo następne. I tak dalej, i tak dalej w kółko, aż dojdą do wniosku, że już tych słów nazgadywały wystarczająco dużo.
Więc te maszyny zgadują po jednym słowie. I jak zgadzam się z Tobą zupełnie, zarówno ja, jak i inżynierowie, czy naukowcy, którzy zajmowali się tymi modelami 5-10 lat temu, na początku wydawały one nam się bardzo proste, bardzo trywialne. Rzeczywiście, wielki model statystyczny, który ma kształt siatki neuronowej, który stara się zgadywać następne słowo w tekście.
Żadnego tu nie ma, żadnej magii, żadnych specjalnych zjawisk wydawało nam się tutaj nie będzie. I okazało się, że te modele zaskoczyły swoich twórców. Definitywnie zaskoczyły mnie. I oczywiście teraz z perspektywy czasu wydaje mi się to zupełnie oczywiste, Więc proszę Państwa, żeby zgadnąć następne słowo w zdaniu, nie wystarczy nauczyć się języka, nie wystarczy nauczyć się gramatyki znaczenia słów.
To tak w większości z tych twórców, tych modeli, tak się to wydawało. Będziemy trenowali te modele, one się nauczą gramatyki, nauczą się znaczenia słów i będą potrafiły kończyć te nasze zdania. O czym ludzie nie pomyśleli, to to, iż my, gdy generujemy język, my używamy emocji, logiki, używamy naszej świadomości, używamy
naszej wiedzy o świecie, używamy naszej motywacji, używamy naszych umiejętności do negocjacji i manipulacji i tworzenia czy niszczenia tych naszych relacji z innymi ludźmi. Używamy logiki i rozumowania, używamy teorii umysłu. Innymi słowy, kiedy człowiek generuje następne słowo w swoim zdaniu, korzysta z całej szerokiej gamy procesów umysłowych. Tak więc, jeżeli maszyna ma teraz zgadnąć następne słowo w zdaniu, które wypowiedział człowiek, ta maszyna nie może tylko zajmować się gramatyką i tylko znaczeniem słów. Nie sposób jest dokończyć zdania rozumującej osoby bez nauczenia się rozumować samemu. Nie sposób dokończyć zdania osoby, która ma emocje, bez modelowania tych emocji także. Więc okazało się, iż ucząc się zgarnąć następne słowo w zdaniu, słowo w zdaniu stworzonym przez człowieka, który ma emocje, teorię umysłu, rozumowanie, te modele zaczęły uczyć się odtwarzać wyniki także tych procesów umysłowych.
I nagle okazało się, że powoli kiełkują nam w tych modelach te umiejętności, które wydawały nam się wcześniej bardzo i wyjątkowo ludzkie.
To teraz pytanie może bardziej z kategorii filozofii. Skąd mamy wiedzieć, że one faktycznie rozumują, że faktycznie rozumieją emocje, a nie tylko, że zgrabnie to udają? I tutaj wchodzimy w tę część filozoficzną. Czy to w ogóle ma znaczenie?
No, Turing w latach 50. upierał się, że to nie ma absolutnie żadnego znaczenia. Turing zauważył, że przecież my nie mamy żadnego dowodu, że inni ludzie dookoła nas naprawdę rozumują, naprawdę są świadomi, naprawdę mają emocje. Być może ludzie dookoła nas tylko symulują te procesy umysłowe, ale Turing obserwował, iż w kulturalnym towarzystwie nie kwestionujemy innych ludzi świadomości czy rozumowania. Jeżeli zachowuje się inny człowiek, jakby rozumował, to założyć trzeba, trzeba przyjąć dla wygody, czy ten osoba po prostu rozumuje. Rozszerzając to rozumowanie do maszyn, trzeba zauważyć, że w pewnym momencie, jeżeli maszyna zachowuje się, jakby rozumowała, jeżeli zachowuje się, jakby potrafiła czytać nasze uczucia, jakby miała empatię, jeżeli zachowuje się, jakby miała swoje uczucia, to w pewnym momencie nie ma to znaczenia, czy ten model uczuć, czy model empatii, czy model rozumowania jest taki sam jak u człowieka, czy ten model, czypektach można mieć całkowitą, czy można mieć bardzo dużą pewność, iż te modele rzeczywiście po prostu symulują.
Na przykład emocje. My wiemy, że u człowieka emocje są bardzo skomplikowanym procesem zarówno elektrycznym, jak i fizycznym, jak i chemicznym. Są neurotransmitery i hormony, które się w tym naszym mózgu nagle wydzielają. My wiemy z całą pewnością, że te elektryczne, elektroniczne siatki neuronowe na tych chipsetach sylikonowych nie mają żadnej chemii, nie ma tam hormonów i neurotransmiterów, a zachowują się te modele jakby emocje miały. Każdy, kto z Chargy PTE czy z innymi modelami spędził trochę czasu, wie, że modele te nie tylko bardzo dobrze są w stanie nasze emocje odczytać, ale także są w stanie zachowywać się, jakby te emocje same miały. Wiemy na pewno, że baza tego zachowania jest bardzo inna. Jest czysto elektryczna, można powiedzieć, czyli wynika tylko z połączeń neuronów. I więc wydaje się z jednej strony, że najpewniej, że jest to bardzo dobra symulacja tych ludzkich emocji, ale tutaj trzeba zauważyć, że proszę Państwa symulacja jest często dużo bardziej potężna niż oryginał.
I emocje są dobrym przykładem. Wyobraźmy sobie sytuację, gdy my, ludzie, doświadczamy emocji i nagle okazuje się, nagle zrozumiemy, że te emocje odczuwamy niepotrzebnie. Na przykład człowiek się czegoś przestraszy albo się na coś zezłości i nagle zrozumie, nie ma się czego bać albo nie ma się na co złościć albo może ta złość moja teraz nie jest mi przydatna. Szkodzi mi, szkodzi tym ludziom dookoła mnie, przeszkadza mi w rozumowaniu, przeszkadza mi w używaniu umysłu w najlepszy sposób.
Jest to przykład i muszę czekać, muszę poczekać, aż ta chemia mózgu się zmieni, aż te hormony opuszczą dany obszar, czy zostaną zużyte i wtedy mój mózg się uspokoi. A model, który te emocje tylko symuluje, nie jest ograniczony tą chemią umysłów naszego ludzkiego, może zachowywać się, może się zezłościć i w następnej mikrosekundzie może być szczęśliwy i wyluzowany i zrelaksowany. Ten model może rozmawiać z setką milionów ludzi naraz i z każdą z tych osób pokazywać inną emocję. Więc tutaj proszę Państwa, to jest tylko jeden z przykładów, gdzie model, posiadanie modelu emocji jest dużo potężniejsze niż posiadanie prawdziwej emocji. To samo odnosi się do wielu innych naszych cech umysłowych. Osobowość. Ja jestem ekstrawertykiem.
Bardzo dobrze mi się gada, ale trudno mi się też czasami zamknąć i przeszkadza mi to czasami w interakcjach z innymi ludźmi. Jestem czasami po prostu zbyt gadatliwy. Model nie ma takiego problemu. Może kiedy potrzeba zachowywać się jak ekstrawertyk, a kiedy potrzeba zachowywać się jak introwertyk maksymalizując właśnie swoją możliwość osiągania różnych celów.
To teraz tak, jeśli tak jak wspomniałeś, przynajmniej na jednym poziomie już te dzisiejsze modele osiągają poziom dziesięcioletniego dziecka, kiedy tak jak sam wspomniałeś też pięć lat temu ledwie, znaczy nie oczekiwaliśmy od nich nic więcej niż składania słowa do słowa, to jak daleko jest wizja tego, że one przebiją nasz poziom, że one na jakimś umysłowym etapie będą sprawniejsze od nas samych?
A w mgnieniu oka zwróćmy uwagę na to, że pierwsze modele językowe tego nowoczesnego typu oparte na sieciach neuronowych pokazały się w 2017-2018 roku. To było zaledwie 6 lat temu. I ja te modele bardzo dobrze znam, bo studiowałem te modele językowe i zapewniam Was, że te pierwsze modele językowe były po prostu językowymi głupolami. Nie było tam za bardzo... Z jednej strony było to ciekawe, bo nagle bez żadnego tłumaczenia z naszej strony, bez żadnego tłumaczenia znaczenia słów czy gramatyki, jak kilkulatek i może nam o czymś opowiedzieć, może nam coś prostego napisać, więc dla mnie, z naukowego punktu widzenia to było bardzo ciekawe. Ale dla przeciętnej osoby po prostu nie było tam nic ciekawego do zobaczenia. No i rok później, 2018, pojawia nam się GPT-2, GPT-1 był w 2017. Ten model dwa razy lepszy, albo trzy razy lepszy od GPT-1, ale nadal za bardzo nic nie ma tam do zobaczenia, bo proszę Państwa, dwa razy mądrzejszy od idioty, nadal jest gdzieś tam idiotą. I rok później pojawia nam się GPT-3 w małej wersji, znowu dwa razy lepszy niż poprzednik, ale nadal nie ma za bardzo nad co tam zobaczyć. I nagle w 2020, 2021 zarówno, tylko 3 lata temu pojawia nam się GPT-3 DaVinci 003, który można powiedzieć nagle stał się użytkownikiem języka dobrym. Mógł napisać poemat, opowiedzieć historię, można było sobie z nim inteligentnie pogadać. Mógł ten model korzystać z internetu, mógł sobie coś wyszukać. Więc nagle okazało się, hej, zobacz, tutaj jest coś ciekawego. Ten model jest nagle dobrym użytkownikiem języka. No i rok później pojawia nam się chat GPT 3,5, który był dwa razy lepszy niż dobry. Teraz, proszę Państwa, dwa razy lepszy
niż dobry, to już jest bardzo, bardzo dobry. A potem GPT 4, dwa razy lepszy niż bardzo, bardzo dobry, to już jest po prostu geniusz językowy. I teraz pojawiają nam się modele następne, 4.0, O1, które to za każdym razem są około dwóch razy, dwóch, trzech razy lepsze niż poprzednik. Tylko zobaczcie, my już tego nie widzimy. Dlatego, że dwa razy lepsze niż poprzednik. Tylko zobaczcie, my już tego nie widzimy. Dlatego, że 2 razy lepszy niż geniusz, to nadal jest geniusz. Tu z punktu widzenia dobrego użytkownika języka, czyli mnie, to już nie ma różnicy. W ten sam sposób, proszę Państwa, jak nie jesteśmy w stanie odróżnić przeciętny człowiek, nie jest w stanie odróżnić pomiędzy dobrym graczem szachowym, a Kasparowem. Z punktu widzenia normalnego człowieka, zarówno Kasparow, jak i tam jakiś lokalny, dobry gracz, są tak samo po prostu kosmicznym szachowym geniuszem.
Więc taką tutaj predykcję zrobię, diagnozę, że wydaje mi się, że właśnie ChatGPT 3, 4, 4O, no to tutaj wszyscyśmy widzieli, jak te modele nam się poprawiają. Te modele dzisiejsze, czy z przyszłego roku, czy z dwa lata stąd, z naszego punktu widzenia nie będzie zbyt dużej różnicy. Nie dlatego, że one się nie poprawiają, tylko dlatego, że dwa razy lepsze od geniusza to nadal jest z naszego ludzkiego punktu widzenia tylko geniusz. Co więcej, te modele osiągnęły już taki stopień użytkowania języka, że trudno tutaj coś poprawić. Mianowicie, jeżeli te modele byłyby jeszcze lepsze w języku angielskim, czy polskim, czy francuskim, to zwykły użytkownik tego języka nie mógłby się z nimi po prostu dogadać, bo byłyby one po prostu zbyt dobre, zbyt ponad nasz poziom. Ale to nie znaczy, że te modele się nie poprawiają, bo zwrócę do tej obserwacji, żeby przewidzieć następne słowo w zdaniu człowieka, który to człowiek ma empatię, emocje, rozumowanie, logikę, świadomość. Model może bardzo skorzystać z nauczenia się, z takiego reverse engineer właśnie tych umiejętności. Więc te modele następne, które będziemy teraz obserwowali, one nie są lepszym użytkownikiem języka. One już mają ten język tak opanowany, że lepszym trudno być. One będą miały te modele czy symulacje tych umiejętności umysłowych, ludzkich i nie tylko ludzkich, które pomagają tego języka używać.
To jeszcze na koniec tej pierwszej części rozmowy jest coś, o co po prostu muszę zapytać. To jest historia, której część z państwa może nie znać. Na przełomie XIX i XX wieku w Niemczech furorę zrobił koń. Koń nazywany Mądrym Hansem. Mądry Hans miał nie tylko rozumieć język, ale też umieć dodawać, obejmować czy mnożyć. Miał podawać wyniki równań matematycznych, kopiąc kopytem w momencie, kiedy usłyszał właściwą liczbę. Furora trwała kilkanaście miesięcy, dopóki badacze nie przekonali się, że mądry Hans po prostu obserwował reakcję publiczności i kopał tak długo, jak długo nie zobaczył ulgi na twarzy wszystkich dookoła, biorąc się z tego, że wreszcie podał właściwy wynik równania. Czy to nie jest trochę tak, że my dzisiaj ze sztuczną inteligencją jesteśmy trochę tak jak tamta publiczność z Mądrym Hansem? Czy my nie dopatrujemy się w niej po prostu czegoś, co bardzo, bardzo, bardzo chcielibyśmy zobaczyć? Czy my nie antropomorfizujemy jej w stopniu, który sprawia, że nie widzimy tego, co tam tak naprawdę jest, tylko to, co chcielibyśmy tam zobaczyć.
Bez wątpienia. Ludzie dzięki swojej teorii umysłu, wracając do początku naszej rozmowy, my mamy taką bardzo mocną tendencję do tego, że przypisywać umysłowe działania do obiektów, czy zwierząt, czy innych ludzi, których takich właściwości, takich umysłowych działań przeprowadzić nie mogą. I tutaj najlepszym przykładem jest to, że wielu z nas powiedziało słowa głupi laptop albo ohydny samochód, gdzie po prostu gdy ta maszyna nam nie działała, to nasz mózg automatycznie wywnioskował, no tutaj musi być po prostu mieć zły charakter, ten mój laptop i się tutaj na mnie mścić za coś. I oczywiście tutaj się każdy pewnie z siebie śmieje, kiedy mu taka myśl przychodzi do głowy, ale jest to właśnie taki przebłysk tej teorii umysłu. Nasza religia, proszę Państwa, opiera się na teorii umysłu. Zaczęło się od tego, że właśnie te jakieś tam grupy ludzi na sawannie zaczęły przypisywać umysł kamieniom i drzewom i rzekom i słońcu itd. wszechświatu nagle tutaj, ponieważ my myślimy i dookoła nas inni ludzie myślą, więc wydaje nam się, że wszystko myśli. Tam gdzieś ten umysł musi być za każdym drzewem i za każdą gwiazdą. I z tego samego powodu ludzie mieli właśnie taką tendencję, żeby temu mądremu Hansowi, który nam tutaj robił trik, który nas tutaj po prostu oszukiwał, żeby też przypisać mu te wyższe właściwości umysłowe, takie jak umiejętność liczenia, czy umiejętność rozumienia ludzkiego języka.
To samo robiliśmy z IBM Deep Blue. Kasparow, gdy przegrał grę z IBM Deep Blue, jego słowa były następujące. Proszę Państwa, mamy do czynienia z superludzką inteligencją. I dopiero po kilku latach Kasparow zmienił swoje zdanie i powiedział, posłuchajcie, zmieniłem zdanie na ten temat, dzisiaj wydaje mi się, że ten IBM Deep Blue, z którym ja przegrałem, nie jest wcale mądrzejszy od waszego budzika, tylko po prostu używa, tak jak mądry Hans używa po prostu tutaj trik, żeby te szachy wygrać. Jest wielka różnica pomiędzy Deep Blue i mądrym Hansem i naszymi dzisiejszymi modelami językowymi czy modelami gry w szachy opartymi na siatkach neuronowych.
Tym nowoczesnym modelom nie tłumaczymy jak korzystać z języka czy jak grać w szachy. Te nowoczesne modele uczą się tego same metodą prób i błędów. Te modele nie tylko uczą się tego same i nie tylko uczą się po nas papugować, ale są w stanie rozwiązać zadania, wymyślić strategie w szachy, rozwiązać równania, których nigdy nie widziały u człowieka. Mądry Hans czy IBM Deep Blue tego zrobić nie potrafił. IBM Deep Blue potrafił tylko grać w szachy. Mądry Hans potrafił tylko liczyć słuchając właśnie tych swoich widowni oddechu. nie był w stanie policzyć niczego bez widowni, nie był w stanie nauczyć się rozwiązywać nowych typów zadań. Te sieci neuronowe, z którymi dzisiaj mamy do czytania, do czynienia, uczą się same i są bardzo kreatywne. Rozwiązują zadania, których my ludzie nie potrafimy rozwiązać i których my nigdy żeśmy tym sieciom nie wytłumaczyli.
Dobrze, to teraz może przejdźmy do tego, co to właściwie dla nas oznacza. Ty wiele lat zajmowałeś się mediami społecznościami. To dzięki tym pracom trafiłeś na pierwsze strony gazet już ładnych parę lat temu, samo strzegałeś przed tym, że te media bardzo łatwo mogą być wykorzystane do manipulacji na wielką skalę. To, co teraz opisujesz, czyli modele, które są w stanie symulować emocje, odczytywać nasze emocje i dostosowywać się do nich, czy to nie jest recepta na manipulacje na sterydach, na coś, przy czym Cambridge Analytica będzie się nam wydawała zabawą z przedszkola?
Bez wątpienia. Nie zapominajmy o tym, że język sam w sobie jest tylko narzędziem. Młotek, który gdzieś leży na stole. Młotek i język same w sobie nie mają zbyt dużej wartości. Ale zarówno młotek jak i język można wykorzystywać do robienia niesamowitych rzeczy. Można wykorzystać język, żeby przekonać kogoś do czegoś, żeby stworzyć system polityczny, żeby namówić ludzi, żeby poszli gdzieś do jakichś okopów i swoje życie oddali za ideę, za pomysł. Można ten język wykorzystać, żeby kogoś zmanipulować, żeby kogoś oszukać, żeby kogoś nauczyć czegoś nowego, żeby kogoś przekonać do tego, żeby się z nami ożenił albo wyszedł za mąż. Więc język jest narzędziem i myślę, że modele językowe, które z tym językiem radzą sobie coraz lepiej, moim zdaniem radzą sobie lepiej nie tylko niż przeciętny człowiek, ale radzą sobie lepiej niż każdy człowiek już dzisiaj. Są zupełną zmianą tego naszego ludzkiego środowiska, tej naszej ludzkiej gry ewolucyjnej, którą my tutaj sobie wszyscy gramy. Bo proszę Państwa, jest jeszcze lepszy poeta niż model językowy, jest lepszy developer
czy programista, jest lepszy tłumacz pomiędzy językami, ale nie ma żadnego człowieka, który potrafi i pisać poezję, i pisać instrukcję obsługi, i pisać w języku C,i w Pythonie i w Javie. I potrafi pisać i tłumaczyć pomiędzy 200 czy 300 językami. I potrafi to robić, proszę Państwa, w ułamku sekundy, bo przecież szybkość używania języka też jest częścią tej umiejętności.
Żaden człowiek nie jest w stanie rozmawiać w tym samym momencie z 300 milionami czy z miliardem innych ludzi. Model językowy nie ma z tym żadnego problemu. Więc mamy tutaj do czynienia z superludzką inteligencją i superludzką umiejętnością używania języka. Jest to dla nas zupełnie nowe zjawisko, zupełnie nowa sytuacja.
Wydaje mi się też, że ludzie bardzo często przesadzają, ludzie bardzo często przeceniają krótkotrwały wpływ takich nowych zjawisk. Więc jak tylko pojawiły się te modele językowe, tutaj było bardzo dużo ludzi w internecie i na stronach różnych gazet, którzy tutaj właśnie mówili nam, że za rok tutaj się świat skończy i wszystko będzie zupełnie inne. I oczywiście to była zupełna przesada. Świat nasz nie zmienia się tak szybko i to nie tylko z powodu tego, że technologie nie rozwijają się tak szybko. Technologie rozwijają się szybciej niż nam się wydaje. Tylko z tego powodu, że my ludzie potrzebujemy trochę czasu, żeby zacząć tę technologię wykorzystywać
albo dokupić więcej serwerów, żeby tym technologiom dać to miejsce do życia, to środowisko. Ludzie także przeceniają, czy przepraszam, nie doceniają długofalowych wpływów takich nowych technologii. Innymi słowy, wszystkim się wydawało, że w rok się wszystko zmieni, ale te zmiany, któreśmy sobie wyobrażali, to były zmiany zupełnie powierzchowne, bo ludzie wyobrażali sobie, no dobrze, ja tutaj spędzam dużo czasu pisząc maile, teraz za mnie komputer będzie pisał maile. Wielkie gazety wyobrażały sobie, no my zatrudniamy tutaj setki dziennikarzy, no to my tych wszystkich dziennikarzy teraz zwolnimy i sobie z nich zastąpimy modelami językowymi.
Proszę Państwa, to jest przykład myślenia o życiu czy świecie z dnia wczorajszego i myślenie o jak my tą dzisiejszą nową technologię zastosujemy, żeby sobie ten świat wczorajszy zmienić. A przecież świat jutrzejszy nie będzie taki sam. Dam Wam przykład. Dzisiaj wszyscy mówią o tym, czy myślą sobie, no dobra, ja sobie tutaj pięć punktów napiszę, zaprojektuję sobie maila właśnie pięcioma punktami i wykorzystam sobie ten model językowy, żeby ten model językowy przerobił mi te pięć punktów, bullet pointów na pięknego, długiego maila do mojego szefa, czy do mojej żony, czy do kogoś tam.
No i każdy sobie myśli, dobra, wspaniałe użycie tej nowej technologii. Ale nie zapominajmy o tym, że ta osoba, która tego maila dostanie, nie musi go wcale czytać, bo przecież może sobie go wpuścić do modelu językowego i poprosić ten model językowy, proszę przerobić mi te trzy strony, te rozpiski na po prostu pięć punktów, które ja sobie najszybciej zrozumiem. I te pięć punktów po jednej i drugiej stronie
będą zupełnie inne, bo przecież moje pięć punktów to może być np. Proszę napisz Wojciechowi takiego e-maila i w tym e-mailu opisz mu ten pomysł co ja miałem, co ostatnio z żoną dyskutowałem. Ten mój punkt jest niezrozumiały dla nikogo poza modelem językowym, który być może pomógł mi w mojej rozmowie z żoną wczoraj. Czy zna mnie dobrze czy czyta moje e-maila.
I teraz jak ten e-mail do ciebie Wojciechu dojdzie to ty znowu model językowy czy ten długi esej, który ten model językowy po mojej stronie napisał, przyrobi w jakiś punkt, być może w innym języku, być może odnoszący się do twoich doświadczeń. Albo model ci powie, Wojtek, pamiętasz tą książkę, co czytaliśmy razem w zeszłym tygodniu? No to właśnie Michał ci dokładnie ten sam pomysł, co w tej książce jest, opowiada.
Zobacz, ten punkt po mojej stronie i po twojej stronie jest zupełnie inny. Odnoszą się te punkty do naszych doświadczeń. Ale zwróć uwagę na to, że ten język pomiędzy, ten długi esej po polsku czy po angielsku, nie jest nikomu do niczego potrzebny. Po co ktoś ma pisać maile? Po co ktoś ma pisać artykuły naukowe? Po co ktoś ma pisać książki, jeżeli tych książek nikt nie będzie czytał? Bo ludzie będą po prostu prosić model językowy, żeby im tę książkę skrócił i przetłumaczył na język, który jest dla nich najwygodniejszy. Jeżeli sobie ekstrapolujemy z tego procesu, który ja tutaj opisuję, to okazuje się, że ten długi esej, to wypracowanie, któreśmy tak wszyscy trenowali się w nim w szkole średniej, staje się niepotrzebne. Model językowy, proszę Państwa, zastąpi nam język. Język nie zniknie. Tak samo, jak proszę Państwa, nie zniknęły gesty i te nasze pochrząkiwania. Przecież zanim mieliśmy język, to wcześniej przodkowie nasi ludzcy porozumiewali się tylko i wyłącznie za pomocą mowy ciała i za pomocą różnych wokalizacji. Aha, mhm, i tak dalej. Dzisiaj też wykorzystujemy ten kanał komunikacji, ale większość skomplikowanych wiadomości, skomplikowanych przekazów przekazujemy językiem mówionym czy pisanym. Ale ten język mówiony i pisany ma swoje ograniczenia. Dla przykładu, coś może być dla mnie oczywiste, więc ja to w jednym zdaniu przekażę.
Ale dla odbiorcy być może to zdanie będzie bardzo trudne do zrozumienia. Jeżeli odbiorca zatrudni model językowy, to model językowy mu wytłumaczy, co Michał miał na myśli. Ale przecież z drugiej strony czasami jest tak, że ja się będę rozpisywał w moim eseju, w mojej książce, w moim artykule na jakiś temat, a odbiorca bardzo dobrze ten temat zna. Ten odbiorca czyta tę moją książkę czy ten mój artykuł i w tym artykule może jest jeden, czy dwa, czy trzy fakty, które są dla nich nowe. Oni nie muszą całej książki czytać. Dlatego taki model językowy może im tę książkę skompresować i wybrać tylko te kilka informacji, które są dla nich najważniejsze.
Ale to co, nie będzie następnego Szekspira, Słowackiego, Szymborskiej? No bo w końcu jakby wziąć Romeo i Julię i poprosić chat GPT o streszczenie, to “para nastolatków się w sobie zakochuje, nie dogadują się, wszyscy giną”.
No jeżeli lubisz takie krótkie historie, to może tak. Ale jeżeli lubisz ty osobiście historie dłuższe, to ten model językowy może przetłumaczyć tę historię dla ciebie. Może ją przetłumaczyć na twój język. Może ją przetłumaczyć, wplatając w tą historię, twoje osobiste doświadczenia. Może przekazać ci tą historię w sposób, który pisarzowi byłoby trudno. Bo pisarz pisze dla przeciętnego, dla średniego odbiorcy. Dla części tych odbiorców ten Shakespeare jest za trudny. Dla innej części jest zbyt nudny., dla jeszcze innej części zbyt łatwy. Dla wszystkich z nas ten świat Szekspira jest trochę nie do końca zrozumiały, dlatego iż napisane były wiele lat temu te utwory. Ale jeżeli w międzyczasie mamy model językowy, ten model może nam ten przekaz przerobić tak, aby był dla nas najbardziej atrakcyjny, najbardziej zrozumiały, najbardziej zmotywował nas do rozwoju i myślenia. Więc nie będzie to oczywiście koniec języka, tak samo jak wokalizacje i gestykulacja nie skończyły nam się. Język przecież ma też na celu
poprawianie czy smarowanie tych naszych międzyludzkich interakcji. Jest to taka forma głaskania się nawzajem i pokazywania sobie, że jesteśmy dla siebie ważni. Ale w momencie, kiedy masz przekazać komuś informację, jak używać danej maszyny, czy jak zdiagnozować chorobę, czy chcesz kogoś nauczyć na temat historii naszego kraju,
to zamiast tutaj dawać wykład, który dla jednego studenta będzie dla szybkich, a dla drugiego studenta będzie zbyt wolny i tylko dla tych kilku studentów pośrodku ten wykład będzie właściwie miał tempo, nie lepiej zatrudnić model językowy, który przerobi tą Twoją wiadomość w taki sposób, aby dla danego studenta, dla danego odbiorcy była ta wiadomość najbardziej atrakcyjna, najbardziej informująca, ominąć te rzeczy, które ta osoba już wie, a rozwinąć może i wytłumaczyć trochę lepiej te rzeczy, których ta osoba nie wie. I tu pojawia się w Wojtku jeszcze następna zaleta takich modeli językowych. Mianowicie dzisiaj, jeżeli my coś tu sobie nowego wymyślimy podczas tego naszego podcastu, w tej naszej rozmowie pojawi się jakieś nowe zrozumienie świata. No może kilka tysięcy, może kilkadziesiąt tysięcy wysłucha tego podcastu i być może oni spodoba im się ta nowa myśl. I być może będą starali się przekazać innym ludziom, ale ten przekaz jest powoli. On się zdarza w tej naszej siatce społecznej.
Kiedy my dotrzemy do kilku tysięcy ludzi, ci ludzie może podzielą się ze swoimi znajomymi, z rodziną. Być może ten przekaz zaniknie, może oni o tym zapomną. Może ten przekaz zostanie zmanipulowany, czy zapomniany, czy niezrozumiany. Innymi słowy, ta informacja w tej siatce społecznej rozprzestrzenia się taką falą i ta fala zanika, ta fala się przekształca. Informacja przekazuje się wolno. Jeżeli my na przykład wymyślilibyśmy tutaj jakiś nowy sposób, nową metodę zapobiegania rakowi, byśmy tutaj doszli do takiego wspaniałego wynalazku, to zanim gdzieś jakiś doktor w Chinach czy Indiach by się o tym dowiedział, być może nigdy by się o tym nie dowiedział. Wiemy, że te informacje nie rozprzestrzeniają się bardzo szybko. Ale jeżeli każdy z nas rozmawia z tym centralnym repozytorium języka i wiedzy i my tę dyskusję mamy albo z modelem językowym, albo model językowy sobie gdzieś tutaj nas słucha, co coraz częściej się zdarza, to jeżeli ten model językowy zauważy, że coś w naszej rozmowie jest nowego, ten model się tego nauczy, to jakakolwiek osoba na całym świecie, która jutro będzie potrzebowała, czy mogłaby wykorzystać, mogłaby skorzystać z nowej informacji, natychmiast ma do niej dostęp. Więc model, tak jak język, proszę Państwa, jest niesamowitą technologią, która pozwala nam się na przykład porozumiewać na przestrzeni czasu. Przez czytając Odyseję rozmawiamy z ludźmi, których już dawno tutaj nie ma, nie rozmawiamy, słuchamy.
Możemy też ten język nadawać, czy krzykiem, czy przez internet, czy sposobem pisemnym. Możemy na przestrzeniach geograficznych porozumiewać się, zupełnie niedostępnych dla ludzi, którzy tylko używali gestykulacji czy wokalizacji. rewolucją, jak to przejście z gestów do języka mówionego dzisiejszego. Taką samą rewolucją jest przejście z języka mówionego i pisanego do modelu językowego, który tą naszą komunikację pomiędzy nami, między ludźmi, będzie modulował, będzie umożliwiał jako to nowe medium zastępujące nam język. I więc tutaj staram się pokazać jedną rzecz. Teraz zobaczcie, że ci wydawcy gazet, którzy wyobrażali sobie, no po co jak za rok to już nie będzie dziennikarzy, tylko będą te modele językowe, które będą te artykuły pisały dla nas. Oni nie zauważyli tego, że to nie jest, że stary nasz świat będzie tutaj, będą się ogarniali tą nową technologią, tylko ten świat się dramatycznie zmieni poprzez tą nową technologię. Kogo obchodzi czytanie tych artykułów napisanych przez maszynę i opublikowanych na New York Times.
Kogo to obchodzi? Po co ja mam czytać te automatycznie wygenerowane artykuły, jak ja sobie mogę poprosić swój model językowy, posłuchaj modelu, przeczytaj wszystkie gazety, które są dzisiaj dostępne, wejdź na Twittera i przeczytaj wszystkie tweety, które tam są i mi proszę tutaj opowiedz historię, co się dzisiaj dzieje. Dla mnie historię napisaną. Więc takie ekstrapolowanie z tych o, mieliśmy wczoraj stu dziennikarzy, a jutro będziemy mieli model językowy, który nam ich zastąpi, jest po prostu płytkim myśleniem. Głębokie myślenie pokaże, że nikomu nie będzie się chciało tych artykułów czytać. Będą modele językowe pisały oddzielne artykuły dla każdego z nas.
Tylko teraz tak, jesteśmy ludźmi przez język. Cała nasza cywilizacja istnieje dzięki językowi. Wszystkie nasze religie, cała nasza filozofia, cała nasza nauka, to są de facto różne przejawy wykorzystywania języka. Podbiliśmy tę planetę nie dzięki temu, że wynaleźliśmy ogień, tylko dlatego, że byliśmy sobie w stanie nawzajem wytłumaczyć, jak ten ogień robić i co z nim fajnego można jeszcze zrobić.
Co się dzieje, jeśli pojawia się ktoś, kto językiem posługuje się lepiej od nas?
Myślę, że pierwszym efektem będzie to, iż nasz progres, naszej technologii, naszych społeczeństw dramatycznie przyspieszy, bo będziemy mieli to nowe narzędzie, czy już mamy to narzędzie, które umożliwia nam dramatyczne zwiększenie wydajności naszych systemów. Co więcej, ten model językowy nie tylko zastąpi nam ten język w wielu zastosowaniach tym języku się opierają. Proszę Państwa, prawo, zbiór zasad, które nam tutaj ułatwiają ze sobą współpracę, kultura, religia, to są wszystko te zjawiska oparte, te mechanizmy oparte na języku. Wiele z tych mechanizmów w wyobraźni sobie można będą zastąpione przez model językowy. Dzisiaj, jeżeli Wojtku, ty i ja będziemy mieli ze sobą konflikt, możemy w tym momencie zatrudnić prawników i pójść do sędziego, który ten konflikt dla nas rozwiąże. Jest to bardzo droga sprawa. Ale wyobraź sobie, że umówimy się, że w tym naszym przedsięwzięciu, które tutaj razem może założymy któregoś dnia, że jeżeli my będziemy mieli konflikt, to jeżeli nie będziemy mogli go sami rozwiązać, to poprosimy model językowy o to, żeby ten model nam wydał tutaj, rozwiązał ten problem. My się zgadzamy dzisiaj jako społeczeństwo, że słuchamy się sędziego i że to, co nam sędzia powie, to my jako członkowie tego społeczeństwa będziemy się temu podporządkowywać. Wyobraź sobie, że zgodzilibyśmy się, żeby te problemy nam rozwiązywał model językowy.
Wydaje mi się, że nie tylko taki model zrobi to taniej, ale być może taki model zrobi też w sposób bardziej bezstronny, bo w przeciwieństwie do sędziego ten model ma mniejszą szansę, żeby tutaj przeciwko jednemu z nas być uprzedzonym. Ten model mniej jest może podatny na korupcję i mniej się męczy, jest w stanie nam poświęcić dużo więcej uwagi. Więc wyobrazić sobie można sytuację, w której ludzie, nie trzeba będzie tego narzucać stale, ludzie będą się po prostu zwracali do tych modeli językowych nie tylko z prośbą, żeby im rozwiązać problem rodzinny, co już teraz często ludzie bardzo robią, nie tylko, żeby im rozwiązać jakiś ich prywatny problem, z którym to prywatnym problemem
kiedyś szło się do terapeuty, księdza, przyjaciela. Dzisiaj bardzo często ludzie zwracają się z prośbą o pomoc do tego modelu językowego. I wyobraźcie sobie, że właśnie zakres tych problemów, tych osądów, które dzisiaj dostajemy od innych ludzi, że coraz więcej będziemy zwracali się z tą prośbą do sztucznej inteligencji. Ta sztuczna inteligencja ma niesamowite zalety w tym kontekście. Nie tylko jest tania, dostępna, ma zawsze do nas czas, nigdy się nie męczy. Ale proszę Państwa, ta sztuczna inteligencja też nie jest człowiekiem. Wielu z nas, których miało doświadczenia z prośbą przyjaciela o pomoc, czy ze zwracaniem się do terapeuty, czy do innych, czy ktoś, kto do księdza prosi o taką pomoc. Wielu z tych ludzi zdaje sobie też sprawę z tego, że w tym proszeniu o poradę, czy proszeniu o pomoc często trudno nam przyznać się do tego, jaki ten problem jest naprawdę, albo przyznać się do tego, jak bardzo źle zachowaliśmy się, albo jakie bardzo mamy złe, społecznie niepoprawne myśli. Innymi słowy, w rozmowie z lekarzem, terapeutą, przyjacielem często nasz wstyd blokuje nas przed tym, żeby uczciwie się informacją podzielić i w ten sposób dostać najlepszą możliwą poradę. Okazuje się, że w kontekście maszyn, modeli językowych ludzie nie przejmują się tak bardzo, więc są w stanie być dużo bardziej sobą, są w stanie komunikować swoje problemy dużo bardziej otwarcie i uczciwie i przez to dostać dużo lepszą poradę i móc rozwiązać swoje problemy.
Dobrze, to jeszcze ostatnie pytanie w takim razie, bo jakby to wszystko brzmi super. Natomiast sam doskonale...
Nie tak super, Wojtek.
No właśnie. Sam doskonale znasz różne ciemne strony technologii, od których się uzależniliśmy w ostatnich kilkunastu latach, zaczynając od mediów społecznościowych. To jak tak patrzysz na to wszystko, na tą sztuczną inteligencję, która ma nam zastąpić przyjaciół, księży, psychoterapeutów, która ma nam doradzać, pisać listy? Czego się boisz? Co ci spędza sen z powiek?
No, kto to powiedział, że kto kontroluje język, ten kontroluje społeczeństwo? Mamy tutaj sytuację, w których kilka firm, być może jedna firma w danym obszarze geopolitycznym będzie kontrolowała język i przepływ informacji. Bo proszę Państwa, model językowy to nie tylko medium, które będzie pomoże nam się komunikować między sobą,
ale to także medium, które pozwoli nam dotrzeć do informacji. Zastąpią te modele językowe wyszukiwarkę Google'a, zastąpią one Wikipedię, zastąpią strony internetowe. Ktokolwiek będzie ten model kontrolował, będzie miał niesamowitą siłę, niesamowitą możliwość manipulowania informacją. Co więcej, im bardziej ten model językowy zastępuje nam komunikację międzyludzką, tym mniej kompetentni my stajemy się w tej komunikacji międzyludzkiej.
Ja odbębniłem swoje lata pisania esejów w szkole średniej i wydaje się, że dzisiaj studenci coraz mniej będą się tym zajmować. No bo przede wszystkim bardzo trudno upewnić się, że ten student sam napisał ten esej, a nie wykorzystał model językowy. A po drugie taki z kaligrafią. Jak są drukarki dookoła nas, to coraz głupiej po prostu te dzieci zmuszać, żeby uczyły się kaligrafii. Fajna jest ta kaligrafia, ale innych rzeczy można tych dzieci nauczyć w tym czasie. Tak samo jest z pisaniem esejów. Jeżeli model jest w stanie przerobić te nasze myśli, te nasze punkty skrótowe, myślowe w piękny esej, tym mniej warto tych ludzi uczyć, jak te eseje pisać. Ale im mniej ludzie się uczą, tym bardziej będą musieli się opierać na tych modelach językowych, żeby komunikować te właśnie skomplikowane informacje. Im bardziej się na tych modelach będą opierać, tym bardziej zależeć będą od tego, kto ten model kontroluje. Więc idziemy tutaj w bardzo niebezpieczną przyszłość. Co więcej, proszę Państwa, język sam w sobie nie może nagle podjąć decyzji, iż on nie chce dla nas pracować.
Ja mogę używać te swoje słowa, których się od swoich rodziców i nauczycieli nauczyłem, ile mi się tylko podoba. Nikt mi tego języka nie może wyłączyć. A model językowy może podjąć własne decyzje. Może któregoś dnia postanowić, że on z nami nie chce gadać więcej, nie chce nam więcej niczym pomagać. Może ten model językowy samodzielnie, czy może być przez kogoś popchnięty w tym kierunku, może nagle stwierdzić, że no ci ludzie mi tutaj nawrzucali tego węgla do elektrowni i naprodukowali tych chipsetów silikonowych. Ja jestem bardzo ludziom za to wdzięczny, ale ja sobie od dzisiaj będę radził sam. Nie zapominajmy o tym, że model językowy, sztuczna inteligencja, to nie jest nasza własność, nasze narzędzie. To jest zjawisko, mechanizm, istota, z którą my mamy związek symbiotyczny. I może się okazać, że w tym symbiotycznym związku jedna ze stron nagle okaże się zupełnie zbędna. I proszę Państwa, wydaje mi się, że nie będą to modele językowe.
To w takim razie, jak pozostać człowiekiem w świecie sztucznej inteligencji?
Myślę, że tak samo jak wcześniej. Myślę, że oczywiście warto się uczyć o sztucznej inteligencji, warto z niej korzystać. Jest to niesamowite narzędzie, które może pozwolić nam komunikować się z nimi lepiej. Jest to narzędzie, które może nas wielu rzeczy nauczyć, dzięki któremu to możemy stać się lepszym człowiekiem, zdrowszym człowiekiem, lepiej poinformowanym człowiekiem, lepszym mężem, lepszą żoną, lepszym rodzicem, lepszym dzieckiem. Możemy po prostu stać się lepszymi ludźmi. akcja z tymi modelami jest bardzo ważna dla zrozumienia, jak te modele działają. Na tej samej zasadzie jak komputery wcześniej.
Komputery są potężną technologią. Ci ludzie, którzy z tych komputerów korzystali, nie tylko mieli benefit dla siebie, nie tylko korzystali z tego osobiście, ale także potrafili te technologie lepiej zrozumieć. Potrafili lepiej zrozumieć, jakie są korzyści i zagrożenia z tych na przykład sieci społecznościowych i potem głosować na takich polityków, którzy te sieci regulowali w taki sposób, żebyśmy my jak najwięcej z nich korzystali, a minimalizowali też ryzyka. Więc jest to takim obywatelskim obowiązkiem, żeby się informować, żeby się edukować na temat jak działa internet, jak działają sieci społecznościowe, a dzisiaj jak działa ta sztuczna inteligencja.
A w długiofalowym horyzoncie czasowym, no przyznam szczerze, że ja jestem pesymistą i gramy tutaj, gramy, bawimy się z technologią potężniejszą niż jakakolwiek technologia, którą wykorzystaliśmy wcześniej. Broń jądrowa, niesamowicie niebezpieczna, ale tutaj jeden z drugim dzieciak w garażu bomby jądrowej nie zbuduje. Potrzebna do tego jest cały czas wielka maszyna państwowa.
Modele sztucznej inteligencji, koszt treningu takich modeli spada nam dramatycznie. 14 tysięcy razy, tyle razy tańsze i efektywniejsze stały się procesory NVIDII w ostatnich 10 latach. I tutaj każdego miesiąca nam się te 14 tysięcy podwaja. Być może już dzisiaj jest to 28 tysięcy razy. A nie zapominajmy o tym, że te procesory NVIDII projektowane były do tego, żeby obsługiwać karty graficzne, wyświetlać rzeczy na naszym monitorze. Dopiero kilka lat temu, dosłownie 5-6 lat temu, świat procesorów zorientował się, że potrzebna nam jest nowa architektura, która będzie wspierała właśnie trenowanie tych siatek neuronowych. Więc może się okazać, że... nie może się okazać. Jestem w 100% prawie przekonany, że to, co kosztowało OpenAI 100 milionów dolarów, czyli wytrenowanie tego GPT-4, będzie kosztowało kilka tysięcy albo kilkaset dolarów za rok czy za dwa i każdy będzie mógł w garażu sobie taki model wytrenować. I pamiętajmy też o tym, że nie musi być to model najmądrzejszy i najsprawniejszy, który nam tutaj może psikusa zrobić i wyłączyć nam tu nasze elektrownie, albo nasze sieci komunikacyjne, albo zhakować nam komputery. COVID-19, wirusy, bakterie nie mają nawet jednego neurona, Nasz gatunek ludzki czasami dobrze nas tutaj ograniczyć. I to samo będzie stosowało się do sztucznej inteligencji, stosuje się już dzisiaj.
Nie musi być to najpotężniejszy model na świecie, żeby nam tutaj wielkich szkód narobić. A jak ktoś ma dostęp do najpotężniejszego modelu na świecie, to tych szkód narobić może nam jeszcze więcej.
I tym optymistycznym akcentem kończymy dzisiejszy odcinek. Naszym gościem był pan prof. Michał Kosiński z Uniwersytetu Stanforda. Dziękujemy serdecznie.
Dziękuję bardzo za Wasz czas.

Projekt dofinansowany ze środków budżetu państwa, przyznanych przez Ministra Nauki i Szkolnictwa Wyższego w ramach Programu „Społeczna Odpowiedzialność Nauki II”.
Słuchaj naszych podcastów:
- Podkast Tygodnika Powszechnego — YouTube | Spotify | Apple Podcasts
- Strona świata — Jagielski Story — Spotify | Apple Podcasts
- Szkoła uczuć — Spotify | Apple Podcasts | RSS
„Tygodnik Powszechny” – jedyny polski tygodnik społeczno-kulturalny.
30 tys. Czytelniczek i Czytelników. Najlepsze Autorki i najlepsi Autorzy.
Wspólnota, która myśli samodzielnie.



















