Badanie komunikacji ptaków długo było sztuką mrużenia oczu. Ludzkie ucho jest zbyt wolne, by wychwycić trwające ułamki sekundy niuanse trelu zięby. Dźwięk trzeba było zamrozić. W połowie XX w. badacze wykorzystali wczesne spektrografy dźwiękowe, zmieniające ptasią muzykę na dane wizualne – postrzępiony wykres (spektrogram) przedstawiający czas i częstotliwości nagranego dźwięku. Aby odnaleźć „gramatykę” ptasiego śpiewu, trzeba było wzrokowo rozstrzygać, gdzie na wykresie kończy się jedna sylaba, a zaczyna kolejna.
By uzyskać spektrogram czytelny dla człowieka, ptaka należało jednak nagrać w laboratoryjnej komorze dźwiękoszczelnej. A przecież dzikie ptaki nie śpiewają w bezgłośnej próżni. Śpiewają w rozhukanym, chaotycznym teatrze szeleszczących liści, szumu deszczu, trzasku gałęzi i nakładających się na siebie głosów kilkunastu innych gatunków. Dla badaczy i wczesnych algorytmów dzika przyroda była zbyt hałaśliwa, by dało się ją dogłębnie analizować.
Te ograniczenia zaczynają kruszeć dzięki zastosowaniu w bioakustyce uczenia maszynowego. Przełomem były takie modele jak TweetyBERT, wytrenowane na wielkich zbiorach ptasich śpiewów, podobnie jak ChatGPT czy Gemini trenowane są na ogromnych bibliotekach tekstów. Są one w stanie samodzielnie odkrywać niewidoczną dotąd dla człowieka strukturę ptasiego śpiewu.
Kiedy badacze wypuścili te modele na tysiące godzin nagrań, odkryli np., że ptaki zdają się stosować do prawa Zipfa. Podobnie jak ludzie, którzy najczęściej używają najkrótszych słów – „i”, „w”, „to” – ptaki używają najkrótszych sylab wokalnych dla najczęściej nadawanych sygnałów. Ta imponująca obserwacja ma w sobie elegancję matematycznego dowodu na coś głębokiego: korony drzew nie są po prostu pełne hałasu. Są pełne złożonej, ale precyzyjnej ekonomii dźwięku.
Jak działają sygnały alarmowe ptaków?
Odkrycie prawideł struktury języka to jednak zaledwie połowa drogi. Jeśli model uczenia maszynowego taki jak TweetyBERT mapuje hierarchię językową lasu – identyfikując fonemy (pojedyncze dźwięki), sylaby i składnię (reguły gramatyczne rządzące ich kolejnością) – to wciąż pozostawia nas wobec głębokiej „luki znaczeniowej”. Zaczynamy pojmować, jak ptaki się komunikują. Ale czy wiemy, co to w ogóle znaczy? Czy wydając dźwięki, mają cokolwiek na myśli?
W historii nauki bardzo długo zakładano, że wokalizacje zwierząt to jedynie odruchy emocjonalne. Ptak krzyczy, bo się boi – tak jak człowiek, którego nagle wystraszymy, albo ktoś, kto dotknie gorącego piekarnika. Zakładano zazwyczaj, że nie idzie za tym semantyka – nie ma żadnych konkretnych znaczeń zakodowanych w dźwięku, informacji o świecie widzianym oczami zwierzęcia. Jednak etolodzy poświęcili ostatnie dwie dekady na stopniowe obalanie tego założenia.
Sikora jasnoskrzydła (Poecile atricapillus) to wszechobecny, niepozorny północnoamerykański ptak ogrodowy, słynący ze swojego charakterystycznego głosu: czik-a-di-di-di – od którego wziął angielską nazwę (chickadee). Przez długi czas sądzono, że to jedynie ogólny sygnał alarmowy. Uważne przyglądanie się mu w terenie ujawniło jednak, że to zawołanie jest w istocie elastycznym i precyzyjnym komunikatem.
Sekret tkwi w „nutach D” ulokowanych na samym końcu sekwencji śpiewu. Kiedy sikora dostrzeże drapieżnika, liczba nut D, które śpiewa, nie jest przypadkowa. Zależy ona od rozmiarów prześladowcy i stopnia zagrożenia. Jeśli ptak dostrzeże puchacza wirginijskiego (Bubo virginianus) – drapieżnika potężnego, ale zbyt dużego i powolnego, by zręcznie manewrować między gałęziami w pogoni za drobnym śpiewakiem – może dołączyć do głosu zaledwie jedną lub dwie nuty D. Sygnalizuje jedynie obecność: niebezpieczeństwo jest, ale duże i niezgrabne.
Jeśli jednak ta sama sikora dostrzeże sóweczkę dwuplamistą (Glaucidium californicum) – małego, niezwykle zwinnego drapieżnika, zdolnego śmigać przez zarośla z zabójczą prędkością – jej głos eksploduje w gorączkową serię pięciu, dziesięciu, a nawet dwunastu nut D. Ptak nie sygnalizuje już tylko niebezpieczeństwa – nadaje szczegółową ocenę zagrożenia. Można o tym myśleć jako ptasim odpowiednik okrzyku: „Mały, szybki drapieżnik. Skrajne niebezpieczeństwo, natychmiast się ukryj!”.
Choć „rozdzielczość” tych komunikatów może się nam nie wydawać szczególnie imponująca, to sam fakt dopasowania struktury komunikatu do treści jest niebagatelny. Świadczy to właśnie o semantycznym charakterze tej komunikacji. I właśnie dlatego rewolucja maszynowego „tłumaczenia” w bioakustyce jest tak kusząca. Jeśli zwykły ptak ogrodowy jest w stanie zakodować tak precyzyjne informacje o środowisku, to o czym rozmawia pozostałe dziesięć tysięcy gatunków?
Ptaki mają swoje dialekty
Mimo przełomów dokonujących się w bioakustyce, dziedzina ta wciąż ma swoje ślepe plamki. Podobnie jak w badaniach psychologicznych najlepiej przebadaną grupą osób są studenci psychologii amerykańskich uniwersytetów, tak w ornitologii wiele badań poświęcono zeberce zwyczajnej (Taeniopygia guttata), zwanej też amadyną zebrowatą.
Ten niewielki ptak śpiewający jest wytrzymały, chętnie rozmnaża się w niewoli i łatwo go „obsługiwać” w hodowli laboratoryjnej, dlatego stał się domyślnym organizmem modelowym dla tej dziedziny badań. W efekcie od dziesięcioleci mapujemy „uniwersalne” prawa ptasiego śpiewu, opierając się głównie na jednym, intensywnie badanym gatunku.
Z prowadzeniem badań w laboratorium jest jeszcze jeden problem – niewola zmienia język. Weźmy amadynę bengalską (Lonchura striata domestica), gatunek blisko spokrewniony ze swoim popularnym laboratoryjnie kuzynem, ale w przeciwieństwie do niego: udomowiony od stuleci. Pozbawione nieustannych presji ewolucyjnych – konieczności ucieczki przed drapieżnikami czy nadawania sygnałów na rozległych, głośnych terytoriach – i pod wpływem kontaktu z człowiekiem ptaki te zmieniły swoje pieśni względem swoich dzikich przodków.
Kiedy więc badacze studiują ptaki w niewoli, często poznają sztucznie chroniony dialekt. By naprawdę zrozumieć ptasi śpiew, trzeba wyjrzeć poza laboratorium, do naturalnego środowiska. Szczególnie ważne staje się badanie gatunków osiadłych, których dialekty pozostają całkowitą zagadką.
Jak ważna jest ta zmiana perspektywy, stało się jasne wiosną 2020 r. Podczas pierwszych lockdownów pandemii – okresu, który ekolodzy nazywają „antropopauzą” – nieustanny szum ruchu, przemysłu i lotnictwa nagle zelżał lub wręcz ustał. I ptaki natychmiast odpowiedziały. Uwolnione od konieczności przekrzykiwania huku silników, miejskie gatunki zaczęły śpiewać ciszej, na niższych tonach i bardziej złożone pieśni. Dosadnie przypomniało to, że ptasi śpiew i kod, który kryje, nigdy nie jest statyczny, lecz głęboko uwikłany także w nasz własny ślad środowiskowy.
Tu jednak właśnie nowa fala modeli sztucznej inteligencji okazuje się najcenniejsza. W miarę jak zmiany klimatyczne i ekspansja człowieka szybko przekształcają ekosystemy, „zdrowie akustyczne” lasu staje się jednym z głównych wskaźników jego ogólnej bioróżnorodności. Nie możemy wysłać wystarczającej liczby naukowców w teren, by ręcznie monitorować, jak kurczące się siedliska wpływają na ptasią komunikację.
Możemy jednak rozmieszczać mikrofony przymocowywane do drzew na całe miesiące – i pozwolić sztucznej inteligencji przetwarzać miliony godzin nagrań. Maszyna nie tylko tłumaczy już śpiew – pełni rolę narzędzia diagnostycznego wysokiej prędkości, mierzącego chociażby, czy słownik lasu kwitnie, czy też powoli osuwa się w ciszę.
Genetyka i wychowanie: jak ptaki uczą się śpiewać?
Sztuczna inteligencja, pomagająca badaczom monitorować pejzaż dźwiękowy lasu, pozwala też zmierzyć się z jeszcze inną zagadką biologiczną: jak ptak właściwie uczy się swojego języka?
U ludzi opanowanie mowy to splot natury z wychowaniem. Przychodzimy na świat z neurologicznym „sprzętem” dla języka, ale potrzebujemy kultury, która nauczy nas „oprogramowania”. Okazuje się, że ptasi świat rządzi się zaskakująco podobnymi, choć surowszymi zasadami.
Większość ptaków śpiewających to, jak mawiają ekolodzy, osobniki uczące się w zamkniętym oknie krytycznym. Posiadają, podobnie jak ludzkie niemowlęta, względnie krótkie okno rozwojowe, podczas którego ich mózgi są bardzo plastyczne. Jeśli w tym czasie nie usłyszą śpiewu swojego gatunku, neurologiczne okno zatrzaskuje się i na zawsze tracą zdolność opanowania swojego typowego śpiewu.
Co jednak dzieje się z ptakiem wychowanym w zupełnej izolacji? Tu właśnie laboratorium i zeberka dostarczyły najgłębszych wglądów w genetykę komunikacji. Jeśli samiec wychowywany jest bez dorosłego nauczyciela, który by go prowadził, nie milczy. Zamiast tego wydaje to, co badacze nazywają „śpiewem naiwnym” – pomieszaną, skrzeczącą plątaninę akustyczną, pozbawioną rytmicznej precyzji dzikiej zeberki. Z punktu widzenia „poprawnego” śpiewu, wygląda on na niezrozumiały dla reszty bełkot.
Przez długi czas naukowcy sądzili, że dowodzi to, iż ptasi śpiew jest w całości wytworem kultury – kruchą tradycją przekazywaną z ojca na syna. W 2009 r. opisany w „Nature” eksperyment Olgi Fehér z Uniwersytetu w Warwick i współpracowników ujawnił jednak zaskakujący zwrot.
Kiedy badacze zebrali kolonię tych izolowanych, „naiwnych” śpiewaków i pozwolili im swobodnie się parzyć, nastąpiła zdumiewająca korekta. W ciągu zaledwie trzech, czterech pokoleń potomkowie sami z siebie zmienili swoje melodie. Nigdy nie słysząc dzikiej zeberki, śpiew kolonii zbiegł się precyzyjnie z powrotem do naturalnej, przodkowskiej melodii gatunku. Kulturowy łańcuch został zerwany, lecz akustyczny plan był prawdopodobnie uparcie wyryty w ich DNA, czekając na ekspresję.
Podwaliny pod rozumienie tej współzależności położył pionier bioakustyki Peter Marler, który dowiódł, że o ile zdolność do śpiewu jest genetyczna, o tyle akcent jest w całości wyuczony. Eksperyment zespołu Fehér posunął tę logikę dalej, odsłaniając głębię samego genetycznego projektu. Dziś wiemy, że pasówka białobrewa (Zonotrichia leucophrys) z jednej doliny wykształci wyraźnie odmienny dialekt regionalny niż jej pobratymiec z sąsiedniej doliny. A modele obliczeniowe potrafią mapować te mikrodialektowe przesunięcia na rozległych obszarach geograficznych, rysując w istocie językowe granice na niebie.
Jednak natura zazwyczaj zostawia miejsce na wyjątek. Nie wszystkie ptaki posiadają ten delikatny mariaż „sprzętu” i „oprogramowania”. Fibik zielony (Sayornis phoebe), pospolity północnoamerykański przedstawiciel tyrankowatych, rodzi się ze śpiewem zakodowanym na stałe w genach. Można by wychować fibika w gnieździe drozdów, a i tak wyrósłby, śpiewając doskonały, nieomylnie rozpoznawalny śpiew swojego gatunku.
Po co śpiewają ptaki? Czasem dla budowania atmosfery
Mimo wykrytego genetycznego zaprogramowania ptasiego śpiewu i regionalnych dialektów rozpoznawanych przez sztuczną inteligencję, przez korony drzew nadal przebija się fundamentalne pytanie: dlaczego ptaki śpiewają tak dużo?
Klasyczna, podręcznikowa odpowiedź jest czysto utylitarna. Od dawna zakładaliśmy, że ptasi śpiew to albo broń, albo miłosne wyznanie. Samiec ogłasza nim swoją kondycję potencjalnym partnerkom albo wyznacza akustyczne granice swojego terytorium, ostrzegając rywali. Jednak w miarę jak badacze poświęcają więcej czasu obserwowaniu subtelnego, codziennego życia tych zwierząt, ta ściśle pragmatyczna wizja zaczyna się chwiać.
Pomyślmy o wodopoju. W wielu środowiskach wodopoje funkcjonują jako wspólne, neutralne terytorium. Ptaki różnych gatunków zbierają się, by pić i kąpać; nie ma bezpośrednich terytoriów do obrony, a gorączkowa rywalizacja sezonu lęgowego jest chwilowo zawieszona. A jednak terenowi etolodzy odnotowują, że ptaki wciąż śpiewają.
Co więcej, samce ptaków śpiewających śpiewają znacznie więcej, niż byłoby to absolutnie konieczne dla przeżycia czy rozmnażania. Jeśli śpiew jest kosztownym metabolicznie zajęciem, które zwiększa ryzyko przyciągnięcia uwagi drapieżników, dlaczego angażować się w to nieustanne „nadśpiewywanie”?
Kiedy naukowcy przyglądają się temu, co określają mianem „śpiewu niekierowanego” – czyli pieśniom niezaadresowanym do konkretnej samicy czy też rywalizującego samca – odkrywają bogate, złożone zachowanie, które wygląda zaskakująco znajomo.
Niektórzy sugerują, że pełni on rolę fizjologicznego reduktora stresu, przypominającego trochę nucenie sobie przez człowieka przy pracy. Inni widzą w nim niezbędną konserwację neurologiczną: skomplikowane ścieżki nerwowe i mięśnie wokalne rządzące złożoną składnią wymagają nieustannego, codziennego ćwiczenia, by pozostać sprawne.
Być może najodważniejsza teoria jednak głosi, że śpiew niekierowany działa jak dźwiękowy klej dla społeczności. Gdy stado śpiewa razem bez bezpośredniego pragmatycznego impulsu, wspólne środowisko dźwiękowe wzmacnia głęboką spójność grupy. Synchronizuje stado, utrwalając więzy społeczne i wspólną tożsamość przed mierzeniem się z chaotycznymi presjami dzikiej przyrody.
Jako istoty, które rozumieją doskonale, że wspólne śpiewanie cementuje – od wieczora przy ognisku, przez piłkarskie stadiony – możemy chyba łatwo zrozumieć, że wspólnota dźwięku wykracza poza sprawozdawczą komunikację.
Narzędzia sztucznej inteligencji pozwalają teraz badaczom śledzić te rozległe, niekierowane chóry, wydzielając subtelne różnice składniowe między poważnym ostrzeżeniem terytorialnym a swobodną, wspólnotową pogawędką. To, co algorytmy odkrywają, zmusza nas do całkowitej zmiany myślenia. Ptak w twoim ogródku to nie tylko biologiczny automat reagujący ślepo na hormony rozrodcze i zagrożenia. To głęboko społeczne stworzenie, uczestniczące we wspólnej, codziennej kulturze akustycznej.
Co łączy mózg człowieka i ptaków śpiewających
Podczas gdy sztuczna inteligencja kontynuuje mapowanie złożoności ptasiego śpiewu, inna grupa naukowców spogląda do wewnątrz – mapując fizyczne mózgi, które ten śpiew wytwarzają. To, co odkrywają, jest być może najbardziej doniosłym objawieniem tej nowej ery bioakustyki. Największym wstrząsem nie jest sam fakt, że ptaki posiadają składnię czy regionalne dialekty – lecz to, że biologiczny mechanizm, za pomocą którego to osiągają, jest zadziwiająco podobny do naszego własnego.
Ewolucyjne ścieżki ssaków i ptaków rozeszły się ok. 320 mln lat temu. Dzieli nas ten ogromny okres; działamy też w zupełnie odmiennych architekturach mózgu. Ptakom brakuje chociażby warstwowej kory nowej, którą ssaki wykorzystują do złożonego poznania, uważanej za jedno z głównych źródeł „intelektualnej” przewagi ssaków.
A jednak badacze tacy jak Erich Jarvis z Uniwersytetu Rockefellera wykazali, że jeśli chodzi o uczenie się nowych dźwięków, natura jest zadziwiająco oszczędna. Wygląda na to, że istnieją fundamentalne, uniwersalne „ograniczenia sprzętowe” konieczne do wytworzenia złożonego języka, którym posługiwanie się wymaga nauki.
W mózgach ptaków śpiewających i ludzi znajdziemy zaskakujące strukturalne podobieństwa. Te same specyficzne skupiska neuronów, zorganizowane w podobne pętle i napędzane przez te same ekspresje genetyczne, odpowiadają za uczenie się nowych dźwięków zarówno u zeberki, jak i u ludzkiego niemowlęcia.
Natura użyła w zasadzie tego samego projektu, by zbudować narząd głosu u naczelnych i u potomków dinozaurów. W biologii ewolucyjnej znane jest to jako głęboka homologia – idea, że odległe gatunki niezależnie doszły do dokładnie tego samego biologicznego rozwiązania złożonego problemu, czerpiąc ze wspólnego zestawu narzędzi genetycznych odziedziczonych po przodkach.
Te neuronalne podobieństwa zmieniają wymiar stawek w naszym obecnym przełomie technologicznym. Narzędzia takie jak TweetyBERT dają nam o wiele więcej niż tylko ptasi słownik. Podstawiają ewolucyjne zwierciadło, w którym sami możemy się przeglądać.
Ponieważ dzielimy z ptakami śpiewającymi tę niezwykłą architekturę neurologiczną, ich głosy mogą oferować pewien wgląd w mechanikę naszego własnego języka. Studiując, jak zeberka się zacina, jak szpak uczy się akcentu lub jak stado używa śpiewu niekierowanego do budowania więzi, zdejmujemy kolejne warstwy tego, jak wokalna komunikacja naprawdę ewoluowała na tej planecie.
Spędziliśmy tysiąclecia, słuchając koron drzew i zakładając, że melodie są po prostu piękną ścieżką dźwiękową dzikiej przyrody. Lecz gdy maszyny zaczynają wreszcie pomagać nam tłumaczyć ten hałas, odkrywamy coś podwójnie pouczającego: gdy uważnie dostrajamy się na ptasie radio, wsłuchujemy się też w nasze własne językowe początki.
„Tygodnik Powszechny” – jedyny polski tygodnik społeczno-kulturalny.
30 tys. Czytelniczek i Czytelników. Najlepsze Autorki i najlepsi Autorzy.
Wspólnota, która myśli samodzielnie.





