Sztuka sztucznej inteligencji

Google chce sprawdzić, czy komputer jest w stanie skomponować wartościową artystycznie muzykę. Ale maszyny już od lat po cichu wkraczają w sferę dziedzin zastrzeżonych dotąd dla ludzi.

Marcin Bójko

13.06.2016

Czyta się kilka minut

Tak sztuczna inteligencja interpretowała tzw. biały szum, szukając w nim regularności (opis na końcu tekstu) / Fot. www.imgur.com // research.googleblog.com

Z komputerami nie mamy się co mierzyć w mnóstwie dziedzin, np. w prędkości obliczeń. Pozostaną tu niezastąpione, choćby często zgodnie z prawem Murphy’ego: ułatwiają nam pracę, której bez nich byśmy nie mieli.

Na przykład potrafią przetwarzać i analizować ogromne ilości danych, które same produkują. Ale wciąż w mnóstwie innych dziedzin są bezradne wobec naszych możliwości. Należy do nich efektywne przetwarzanie obrazu i dźwięku: komputery wciąż mają większy problem z rozpoznaniem twarzy i poruszaniem się w przestrzeni niż trzyletnie dziecko.

Tyle że krąg tych dziedzin się kurczy. A twórcy komputerów atakują kolejne bastiony ludzkości.

Ograć mistrza

Istnieje np. cała klasa dramatycznie skomplikowanych zagadnień, z którymi jakoś musimy sobie radzić. Sztandarowym przykładem jest tzw. problem komiwojażera. Polega na wyborze optymalnej marszruty między kilkoma miastami połączonymi drogami. Okazuje się, że już przy kilkunastu miejscowościach problemu nie da się rozwiązać „na siłę”, tzn. obliczając wszystkie możliwe trasy i wybierając najkrótszą. Ponieważ jakoś żyć trzeba, na co dzień szukamy różnych rozwiązań przybliżonych, lepszych lub gorszych.

Tak też jest w przypadku gier planszowych, jak warcaby, szachy czy go. Turnieje gier planszowych między ludźmi oznaczają pojedynek na intuicje – wygrywa ten, kto potrafi znaleźć lepsze rozwiązanie. Wydawało się, że komputery nigdy nie poradzą sobie z grami planszowymi – nie da się w nie grać metodami siłowymi, czyli znaleźć wszystkie możliwe ruchy i konsekwentnie wybierać tę ścieżkę, która zawsze prowadzi do wygranej. Ale stosując różne metody wyboru właściwej strategii, informatycy konsekwentnie tworzyli programy, które potrafiły wygrać w warcaby czy szachy. Niedawno padł kolejny bastion: gra w go.

Jeszcze kilka lat temu komputery nie potrafiły ograć w go nawet pięcioletniego dziecka, lecz w marcu tego roku odbył się turniej, w którym zawodnik klasy mistrzowskiej przegrał z komputerem. Co najciekawsze, program, który ograł mistrza, rozpoczął naukę gry ledwie pół roku przed turniejem, a wiedzę zdobywał metodą swoistego samodoskonalenia. Najpierw dostał do przeanalizowania zapisy kilku milionów partii rozegranych między ludźmi, później rozegrał kilka pojedynków z coraz mocniejszymi zawodnikami, następnie zaczął grać sam ze sobą. Doświadczenia z każdej kolejnej partii kumulowały się i na początku 2016 r. program uzyskał już taką sprawność, że był w stanie zmierzyć się z ludzkim arcymistrzem.

Teraz naukowcy, którzy opracowali ów program do gry w go, chcą pójść krok dalej. I sprawdzić, czy komputery są w stanie komponować muzykę, która podobać się będzie ludziom. Mecenasem projektu jest firma Google (ona też sponsorowała pojedynek w go), całość nosi nazwę Magenta i, co najważniejsze, jest projektem typu Open Source. To znaczy takim, gdzie wyniki pracy są dostępne dla wszystkich i za darmo.

Pogawędka z maszyną

Google przoduje w projektach, w których sztuczna inteligencja ma zastępować ludzi. Od wielu lat trwają prace nad autonomicznymi pojazdami, które będą w stanie bezpiecznie poruszać się po drogach. Auta Google bez kierowców, na razie w ramach eksperymentu, jeżdżą już po szosach USA i zaliczyły mniej stłuczek niż przeciętny amerykański kierowca. Nad podobnymi systemami pracują też wszyscy poważni producenci samochodów, a pierwszymi jaskółkami są systemy automatycznego parkowania, dostępne już jako normalne wyposażenie w wielu autach.

Podobnie jest z systemami pilotującymi różnego rodzaju statki powietrzne. Amerykanie już kilka lat temu dopuścili do normalnego ruchu lotniczego wojskowe samoloty bezzałogowe, które poruszają się na takich samych prawach jak wszystkie inne samoloty w przestrzeni powietrznej. To oczywiście oznacza, że muszą umieć się porozumiewać z kontrolą ruchu powietrznego, by prosić o zgodę na przelot, i wykonywać polecenia kontrolerów.

O ile kierowanie pojazdami jest czynnością mało kreatywną, o tyle pisanie tekstów i konwersacja, wydawałoby się, jest domeną czysto ludzką. Dawno temu ojciec dzisiejszej informatyki Alan Turing wymyślił nawet sposób weryfikacji, czy maszyna jest w stanie posługiwać się językiem naturalnym. Jego zdaniem wystarczy, że sędzia konwersujący z człowiekiem bądź z maszyną nie będzie w stanie w ciągu pięciu minut rozróżnić, z kim ma do czynienia. Konkursy według tych reguł organizowane są na całym świecie jako swoisty test jakości systemów do prowadzenia konwersacji, zwanych czasem czatbotami. I już w 2011 r. pojawiły się programy, które były w stanie skutecznie oszukać sędziów.

Dziś prace nad takimi systemami są dalece bardziej zaawansowane. Raymond Kurzweil, amerykański informatyk, futurolog i pionier w dziedzinie syntezatorów mowy, pracuje – znowu wspólnie z Google’em – nad automatami, które nie tylko rozmawiają z ludźmi za pośrednictwem czatu, ale wręcz naśladują konkretny styl wypowiadania się. Kurzweil jako naukowiec ma już na koncie stworzenie programów, które potrafią czytać zeskanowany tekst wydrukowany dowolną czcionką. Jego czatbot ma naśladować styl konkretnego człowieka po przeczytaniu kilku dzieł – i w gruncie rzeczy nieważne, czy chodzi o Ernesta Hemingwaya, czy o autora popularnego bloga.

Nie bez powodu Google inwestuje w tego typu systemy. Umiejętność prowadzenia konwersacji nieodłącznie wiąże się z koniecznością zrozumienia tekstu. Jeśli komputery nauczą się rozumieć język naturalny, wtedy bardzo łatwo będzie skonstruować skuteczne narzędzie do tłumaczenia języków. Jak na razie, działa to względnie dobrze, ale daleko do ideału – o czym najłatwiej się przekonać, dając jakąś próbkę tekstu do przetłumaczenia translatorowi Google.

A koniec końców, rozumienie języka naturalnego jest też sposobem na poprawienie jakości wyszukiwarki Google, która jest przecież sztandarowym produktem firmy.

Komputer dziennikarzem

Stąd tylko krok do pisania tekstów przez komputery. Miło jest myśleć, że agencja informacyjna zatrudnia dziennikarzy, którzy pozyskują informacje, ubierają je w słowa i dopiero wypuszczają w świat. Ale już w 2014 r. agencja Associated Press wdrożyła technologię, która... generowała depesze agencyjne. Chodziło – na szczęście dla dziennikarzy – o depesze dotyczące kursów giełdowych. System komputerowy podłączony bezpośrednio do systemów giełdowych generował automatycznie raporty dotyczące zmian cen. Korzyść, wbrew pozorom, odnosiła zarówno agencja, jak i jej dziennikarze, którzy nie musieli już ślęczeć nad tabelami giełdowymi, by jak najszybciej przekazać informacje. Agencja miała z kolei depesze znacznie szybciej, niż byłby je w stanie napisać człowiek, a prawdziwi dziennikarze mogli się zająć czynnościami wymagającymi kompetencji, których komputerom brakuje. Jeszcze.

Podobne systemy wykorzystują już także „Los Angeles Times” (informacje o wstrząsach sejsmicznych) czy „Forbes” (informacje giełdowe). Jeśli teraz połączyć to z systemem Kurzweila, który może naśladować dowolny styl pisania, to okazuje się, że na teksty pisane stylem Josepha Pulitzera będzie sobie mogła pozwolić każda redakcja...

Google Magenta będzie bardzo ciekawym eksperymentem – kolejnym krokiem sztucznej inteligencji w sferę dziedzin zarezerwowanych dotąd wyłącznie dla ludzi. Oczywiście, można mieć obawy, że skoro wyniki prac będą prezentowane w internecie, a muzykę oceniać będą szerokie rzesze publiczności, to komputer stanie się mistrzem w komponowaniu disco polo. W dodatku, gdy posłuchamy pierwszej kompozycji wyprodukowanej przez komputer, bez trudu dostrzeżemy, że Czajkowski to to nie jest.

Pamiętajmy jednak, że podobny system nauczył się grać w go od zera do poziomu mistrzowskiego zaledwie w pół roku. ©

WYŚNIONE W SIECI NEURONOWEJ

Systemy sztucznej inteligencji bardzo często budowane są tak, że symulują sposób funkcjonowania mózgu żywego stworzenia. Mówi się nawet o „sieciach neuronowych”, bo obliczenia wzorowane są tu na procesach, w ramach których neurony komunikują się i wymieniają danymi. Aby uzyskać sztuczną inteligencję grającą w go, rozpoznającą obrazy albo diagnozującą choroby, trzeba ją najpierw nie tyle zaprogramować, co nauczyć, wytrenować. Np. systemowi mającemu rozpoznawać obrazy pokazuje się zdjęcia i tłumaczy: to jest banan, krowa, kokos, budynek.

Naukowcy opracowujący algorytmy rozpoznające obrazy w wyszukiwarce Google – ale także np. te na Facebooku – również stosują sieci neuronowe do przetwarzania zdjęć, by system wiedział, co na nich jest. Gdy dobrze wytrenowanej sieci neuronowej pokażemy zdjęcie, ta odpowie, co ono przedstawia. Ale inżynierowie postanowili sprawdzić, co będzie, jeśli się ten proces odwróci: gdy dobrze wytrenowanej sieci neuronowej poda się nazwę przedmiotu i poleci pokazać, jak on wygląda. Doprowadziło ich to do zaskakujących odkryć. Np. komputer poproszony o stworzenie obrazu hantli, narysował je wraz z... ludzką ręką – nie rozumiejąc, że hantle są oddzielnymi bytami i nie zawsze występują w połączeniu z przedramieniem.

Kolejny eksperyment inżynierów polegał na podaniu sztucznej inteligencji „pustej kartki”, a ściślej – zdjęcia zawierającego tzw. „biały szum”, czyli losowo rozrzucone kropki. Komputer, poszukując jakiejkolwiek regularności, tworzył niesamowite obrazy (u góry), które można nazwać „snem”. A może – dziełem sztuki? ©
MB

nauka