„Fake video” – nowa bomba propagandowa

Naukowcy opracowali właśnie oprogramowanie umożliwiające odtworzenie mimiki twarzy dowolnego człowieka i stworzenie obrazu, który dopasuje ruch warg do dowolnego tekstu.

17.07.2017

Czyta się kilka minut

Screen z kanału Supasorn Suwajanakorn na YouTube /
Screen z kanału Supasorn Suwajanakorn na YouTube /

Na pierwszy rzut oka 19 lutego 1990 roku nie wygląda na przełomową datę. Z pierwszych stron gazet można wyczytać tylko, że w Nepalu i Rumunii doszło do zamieszek, a w Kazachstanie wylądowała kapsuła Sojuz. W „Wiadomościach” „jedynką” była wizyta prezydenta Jaruzelskiego w Gorzowie.

Ale to był dzień, który miał kolosalne konsekwencje dla naszego postrzegania rzeczywistości. Tego dnia firma Adobe opublikowała pierwszą edycję programu Photoshop. Pakietu do edycji obrazów, stworzonego przez braci Thomasa i Johna Knolli, który błyskawicznie stał się standardowym narzędziem pracy milionów grafików, fotoedytorów i fotografów.

A także ludzi tworzących propagandę. Przymiotnik „sfotoszopowany” wszedł do powszechnego użycia tak samo jak zmanipulowane w celach komercyjnych czy politycznych obrazy. Oczywiście retusz jest zjawiskiem starszym niż fotografia, ale to Photoshop zdemokratyzował manipulację obrazem. Od jego premiery nauczyliśmy się nie ufać do końca zdjęciom.

Teraz powinniśmy nauczyć się tego samego z obrazami video.

Naukowcy z Uniwersytetu Wisconsin opracowali właśnie oprogramowanie umożliwiające odtworzenie mimiki twarzy dowolnego człowieka i stworzenie obrazu, który dopasuje ruch warg do dowolnego tekstu.

Sieć neuronowa, czyli zdolny do nauki program symulujący działanie zwierzęcego układu nerwowego, przeanalizowała w tym celu wiele godzin nagrań przemówień Baracka Obamy. Komputer nauczył się tego, jak ruchy warg byłego prezydenta USA odpowiadają wydawanym dźwiękom. A potem – opierając się już wyłącznie na zapisie audio – odtworzył najpierw same wargi, a potem całą twarz przemawiającego przywódcy z niepokojącą dokładnością.

Adres URL dla Zdalne wideo

Dlaczego niepokojącą? Bo takie technologie otwierają drogę do wkładania w usta ludziom wypowiedzi, które nigdy nie padły. Wystarczy wyciąć pojedyncze słowa wypowiadane przy rozmaitych okazjach i skleić je w taki ciąg, który nie będzie zawierał żadnych wyraźnych skoków tonu czy nienaturalnych brzmień. To coś, co byłby w stanie zrobić niemal każdy montażysta czy radiowiec. Następnie przepuszczamy takie nagranie przez „wyszkoloną” sieć neuronową i voila! W najlepszym przypadku Marylin Monroe zaprasza na hamburgera do jakiegoś baru. Albo John Wayne ponownie zagra główną rolę w najnowszej hollywoodzkiej superprodukcji. W najgorszym przypadku któryś ze światowych przywódców wypowiada słowa, które prowadzą do wojny.

Oczywiście na razie tworzone w taki sposób obrazy nie sa jeszcze w stu procentach doskonałe: w prezentacji uczonych symulowany Obama jest zestawiony z prawdziwym. Podobieństwo jest uderzające, choć w ruchach replikanta jest jakaś ledwo wychwytywalna nerwowość, szarpnięcia i skoki które – kiedy skupiamy się na szukaniu różnic – potrafią wyrwać z iluzji.

Ale, po pierwsze, kluczowe jest zastrzeżenie „na razie”. A po drugie, prawdziwy problem w tym, że trafiając na fake newsa nie będziemy mieli takiego porównania. Wystarczy spojrzeć na to, jak przytłaczający efekt miały w ubiegłym roku fałszywe, choć mało prawdopodobne informacje, takie jak ta mówiąca o tym, że Papież Franciszek poparł Donalda Trumpa, przekazana dalej ponad milion razy podczas ubiegłorocznej prezydenckiej kampanii w USA, żeby zrozumieć, że nawet niedoskonały fejkowy przekaz wzbogacony o fejkowe video może być prawdziwą propagandową bombą atomową.

A jego autorzy nie będą nawet musieli bawić się w mozolne zlepianie słów. Kanadyjski start-up Lyrebird pokazał w maju swój, również oparty na sieciach neuronowych, system syntezujący głos dowolnego człowieka. Tak jak w przypadku fabrykowanego video, komputer najpierw słucha nagrań głosu, porównuje je z transkryptami, a następnie produkuje dość przekonującą kopię, wypowiadającą dowolne zdanie.

Seeing is believing” – „Widzieć to znaczy wierzyć” mawiają Anglosasi. Chyba czas wyłączyć z tego powiedzenia wszystko, co widzimy na wszelakich ekranach. Póki co możemy wierzyć w to, co widzimy na własne oczy. Dopóki ktoś nie wymyśli sposobu na to, żeby „sfotoszopować” rzeczywistość.

Dziękujemy, że nas czytasz!

Wykupienie dostępu pozwoli Ci czytać artykuły wysokiej jakości i wspierać niezależne dziennikarstwo w wymagających dla wydawców czasach. Rośnij z nami! Pełna oferta →

Dostęp 10/10

  • 10 dni dostępu - poznaj nas
  • Natychmiastowy dostęp
  • Ogromne archiwum
  • Zapamiętaj i czytaj później
  • Autorskie newslettery premium
  • Także w formatach PDF, EPUB i MOBI
10,00 zł

Dostęp kwartalny

Kwartalny dostęp do TygodnikPowszechny.pl
  • Natychmiastowy dostęp
  • 92 dni dostępu = aż 13 numerów Tygodnika
  • Ogromne archiwum
  • Zapamiętaj i czytaj później
  • Autorskie newslettery premium
  • Także w formatach PDF, EPUB i MOBI
89,90 zł
© Wszelkie prawa w tym prawa autorów i wydawcy zastrzeżone. Jakiekolwiek dalsze rozpowszechnianie artykułów i innych części czasopisma bez zgody wydawcy zabronione [nota wydawnicza]. Jeśli na końcu artykułu znajduje się znak ℗, wówczas istnieje możliwość przedruku po zakupieniu licencji od Wydawcy [kontakt z Wydawcą]
Dziennikarz naukowy, reporter telewizyjny, twórca programu popularnonaukowego „Horyzont zdarzeń”. Współautor (z Agatą Kaźmierską) książki „Strefy cyberwojny”. Stypendysta Fundacji Knighta na MIT, laureat Prix CIRCOM i Halabardy rektora AON. Zdobywca… więcej