Nareszcie porozmawiamy ze zwierzętami? Rok 2025 może być przełomowy

Część naukowców przewiduje, że rok 2025 może stać się punktem przełomowym w badaniach nad komunikacją różnych gatunków – od kaszalotów i delfinów, przez golce i nietoperze, aż po ptaki. Motorem postępu są coraz doskonalsze algorytmy sztucznej inteligencji i konkursy takie jak Coller-Dolittle Prize, których celem jest zachęcenie badaczy do złamania kodu zwierzęcej mowy.

Nareszcie porozmawiamy ze zwierzętami? Rok 2025 może być przełomowy
Nareszcie porozmawiamy ze zwierzętami? Rok 2025 może być przełomowy123RF/PICSEL

Rosnąca popularność niedrogich rejestratorów dźwięku, takich jak AudioMoth, sprawiła, że naukowcy są w stanie niewielkim kosztem prowadzić wielomiesięczne nagrania tysięcy gatunków ptaków, ssaków czy owadów. Do tego dochodzi automatyczna analiza nagrań za pomocą sieci neuronowych. Jeszcze kilka lat temu przeglądanie tak ogromnych baz danych byłoby pracą dla setek asystentów. Dziś robi to kilka linijek kodu korzystających z modelu AI.

Nareszcie zrozumiemy mowę zwierząt? Może powstać translator

Wyłonione w ten sposób struktury i wzorce trafiają następnie do systemów, które funkcjonują podobnie do dużych modeli językowych (LLM), takich jak ChatGPT. Te potrafią odkrywać subtelne regularności w piskach nietoperzy czy nawoływaniach delfinów, starając się odnaleźć "słowa" lub sekwencje odpowiadające kontekstom społecznym.

Niektórzy badacze mówią już otwarcie o wizji translatora zwierzęcej mowy – a przynajmniej o dekodowaniu sygnałów na tyle, by rozróżnić np. wołanie alarmowe, interakcję godową czy okrzyki typowe dla kłótni o zasoby.

Zdaniem izraelskiego neuroekologa Yossiego Yovela, współtwórcy "Doctor Dolittle Challenge", kluczowe jest nie tylko rozpoznanie i naśladowanie dźwięków, lecz także wywołanie autentycznej reakcji zwierzęcia. "Możemy generować sztuczne kliknięcia kaszalota – nawet takie, które nigdy wcześniej nie padły – ale skąd pewność, że inny kaszalot nie uzna ich za przypadkowy hałas?" - pyta zespół Yovela na łamach "Current Biology".

Badacze wskazują, że systemy generatywne (np. sieci typu GAN lub transformery) już dziś tworzą dźwięki łudząco podobne do oryginalnych. Wyzwanie leży w tym, by umieścić je w kontekście, którego znaczenie jest wspólne dla nadawcy i odbiorcy. Innymi słowy, nawet jeśli AI odtworzy sekwencję nietoperzych pisków idealnie naśladującą dany sygnał godowy, pozostaje pytanie, czy nietoperz odebrał je jako "zaproszenie", czy zupełnie je zignorował. Bez bezpośredniej reakcji zwierzęcia naukowcy mogą jedynie zgadywać.

Dzięki postępowi technologicznemu naukowcy są coraz bliżej komunikacji np. z wielorybamiFranco Banfi / BiosphotoEast News

Badacze z Interspecies.io zauważają też, że w wielu wypadkach komunikacja odbywa się też za pośrednictwem bodźców niedostępnych człowiekowi: chemicznych, dotykowych czy wibracyjnych. "Jeśli ograniczymy się do analizy dźwięku, możemy przeoczyć ważne elementy ‘zdania' w języku zwierząt" – mówi w rozmowie z "Wired" członek zespołu. Dlatego kolejny krok polega na łączeniu danych z kamer termowizyjnych, rejestratorów wibracji i czujników zapachów z dźwiękowym zapisem wokalizacji.

Prace nad takimi wielowarstwowymi bazami danych już trwają w różnych ośrodkach na świecie. Zespoły naukowe tworzą algorytmy, które najpierw grupują podobne wzorce akustyczne, a następnie sprawdzają, w jakim kontekście społecznym – np. kłótni o jedzenie, szukania miejsca do spania czy zalotów – dana sekwencja dźwięków się pojawia.

W takim systemie prawdziwym wyzwaniem jest weryfikacja. Musimy przeprowadzać eksperymenty z odtwarzaniem nagranych lub sztucznie wygenerowanych serii dźwięków i obserwować, czy w kolonii nietoperzy wystąpi pożądana reakcja
pisze Yossi Yovel.

Po co nam rozmawianie ze zwierzętami?

Zwolennicy idei "zwierzęcych translatorów" przytaczają liczne przykłady praktycznych zastosowań. Algorytmy oparte na sieciach neuronowych już dziś pomagają rolnikom monitorować stan stad zwierząt hodowlanych. Na farmach drobiu w USA instaluje się mikrofony, które rejestrują odgłosy kur lub indyków. System potrafi wykryć nagłe zmiany w częstotliwości gdakania czy gulgotu, mogące świadczyć o stresie lub zagrożeniu chorobą. System AI alarmuje o konieczności wizyty weterynarza zanim szkody staną się nieodwracalne.

Podobnie w hodowlach bydła trwają testy monitorowania muczenia krów w kontekście bólu czy zbliżającego się porodu. Zespół z Kanady deklaruje, że potrafi zidentyfikować specyficzne wokalizacje poprzedzające problemy z racicami nawet o kilka dni. O wiele większą ciekawość budzą jednak zwierzęta z bardziej skomplikowanymi układami społecznymi, jak słonie, szympansy, delfiny czy właśnie kaszaloty.

Komunikacja ze zwierzętami byłaby bardzo pomocna np. dla rolników123RF/PICSEL

Zalet takiego rozwiązania jest wiele, ale pojawiają się też liczne dylematy etyczne. Jeżeli odkryjemy, że świnie przekazują sobie informacje o poziomie strachu lub cierpienia, to co to oznacza dla przemysłowych ferm? Czy nagle nie będziemy musieli przewartościować naszych praktyk? Albo czy rolnicy stosujący wciąż intensywną hodowlę nie uznają, że to zwykłe fanaberie naukowców?

"Tu pojawia się prawdziwe pole do dyskusji – jeśli chcemy rzeczywiście wsłuchać się w głos zwierząt, może to nas zaprowadzić do niewygodnych wniosków" – mówi jeden z uczestników Coller-Dolittle Prize, pragnący zachować anonimowość.

Inny temat to ochrona przyrody. Czy translator mowy delfinów da się wykorzystać w sposób odpowiedzialny? "Jeżeli zrozumiemy, gdzie i kiedy delfiny ‘mówią’ sobie o żerowiskach, czy nie stworzymy pokusy, by to wykorzystać do prowadzenia bardziej efektywnych połowów?" – pyta retorycznie jeden z ekspertów. Część badaczy podkreśla, że celem jest raczej poprawa dobrostanu zwierząt, a nie wykorzystywanie ich komunikacji dla komercyjnych celów.

Kaszaloty w centrum zainteresowania

Wieloryby, a w szczególności kaszaloty, przyciągają uwagę ze względu na niezwykle rozbudowane sieci społeczne i największe mózgi w królestwie zwierząt. Od dawna wiemy, że kaszaloty posługują się kliknięciami (tzw. codas), tworząc lokalne "dialekty" przekazywane z pokolenia na pokolenie. Istnieją dowody na to, że różne klany potrafią wykształcać odmienne zestawy kliknięć, a młode wieloryby uczą się ich przez coś w rodzaju "gaworzenia".

Zespoły badawcze wielokrotnie opisywały przypadki kulturowego dziedziczenia wzorców zachowań u kaszalotów. W XIX w., kiedy pojawiły się duże, przemysłowe statki wielorybnicze, te ssaki morskie szybko zrozumiały, że dotychczasowe taktyki obronne – np. tworzenie ciasnego kręgu z młodymi w środku – są nieskuteczne przeciwko ludziom.

Zamiast tego nauczyły się uciekać pod wiatr, co radykalnie zmniejszyło liczbę wytępionych osobników. "Zachowanie to rozprzestrzeniło się w ich społecznościach w ciągu zaledwie kilku lat, co pokazuje, że mamy do czynienia z dynamiczną kulturą" – podkreśla David Gruber z City University of New York.

Badacze usiłują sprawdzić, czy w komunikacji kaszalotów występują struktury przypominające gramatykę. Dzięki wieloletnim nagraniom z wodach wokół Dominiki udało się zidentyfikować pewne podjednostki we wzorcach kliknięć, które pojawiają się w konkretnych sytuacjach, np. przy zwoływaniu grupy lub ostrzeganiu przed zagrożeniem. Wciąż jednak nie mamy pewności, czy te dźwięki tworzą zdania w takim sensie, w jakim rozumiemy je u ludzi.

Podejrzewa się, że kaszaloty mają bardzo rozwinięty sposób podwodnej komunikacji dźwiękowejGabriel Barathieu Wikimedia Commons

To właśnie doprowadziło do powstania międzynarodowego konsorcjum CETI (Cetacean Translation Initiative), w którym obok biologów morskich i akustyków zasiadają specjaliści od kryptografii, lingwiści, eksperci w dziedzinie uczenia maszynowego i robotycy. "Plan jest prosty w założeniach, choć trudny w realizacji: rozciągniemy w okolicy Dominiki rozległą sieć hydrofonów i czujników, by rejestrować każdy odgłos kaszalotów w połączeniu z danymi o ich zachowaniu" – tłumaczy Gruber, inicjator projektu.

Zebrane w ten sposób potężne zbiory dźwięków i obserwacji zachowań trafią do zaawansowanych algorytmów. "Chcemy nie tylko zidentyfikować poszczególne osobniki, lecz także ustalić, w jakim momencie i w jakim celu wydały konkretną serię kliknięć" – wyjaśnia jeden z programistów CETI. "Jeśli uda się uchwycić korelację między określoną sekwencją dźwięków a aktywnością, np. wspólnym polowaniem czy zabawą, możemy zacząć spekulować, że sekwencja ta ma wspólne znaczenie u wszystkich członków klanu".

Kolejnym krokiem ma być próba aktywnego "wypowiadania się" w mowie kaszalotów, czyli generowania serii kliknięć i odtwarzania ich w obecności żywych zwierząt, tak aby sprawdzić, czy doczekamy się odpowiedzi. Dodatkowym wyzwaniem jest zasięg i głośność dźwięków kaszalotów – są to jedne z najpotężniejszych odgłosów w świecie przyrody, osiągające ponad 200 decybeli pod wodą. Dlatego inżynierowie CETI rozwijają sprzęt do emisji sygnałów o parametrach zbliżonych do naturalnych kliknięć.

Gruber w wywiadzie dla "Wired" przyznaje, że finalnym celem nie jest rozmowa z kaszalotami w ludzkim rozumieniu. "Nie oczekujemy, że spytamy je, co sądzą o globalnym ociepleniu, ale jeśli uzyskamy potwierdzenie, że istnieją w ich komunikacji precyzyjne słowa lub zawołania’, i będziemy w stanie podjąć interakcję w tym samym kodzie, to już będzie spektakularne odkrycie" – twierdzi biolog.

Rok 2025 ma być przełomowy

Na pytanie, dlaczego akurat rok 2025 miałby przynieść tak wielki przełom, badacze wskazują trzy główne powody. Po pierwsze, szybki spadek cen czujników i wzrost jakości rejestrowanego materiału. "Nagranie dziesiątek tysięcy godzin było dotąd praktycznie niewykonalne. Dziś wystarczy kilka dobrze skonfigurowanych boi, by zebrać dane na skalę, o jakiej nie śniliśmy" – przyznaje inżynier pracujący przy Coller-Dolittle Prize.

Po drugie, rozwój algorytmów – od konwolucyjnych sieci rozpoznających wzorce, po generatywne modele w stylu GPT. Sztuczna inteligencja nie tylko potrafi grupować podobne dźwięki, lecz także – na wzór translatorów lingwistycznych – uczyć się kolejności i częstotliwości ich występowania. Pozwala to wykrywać, czy np. zwierzę dodaje lub usuwa pewne elementy sekwencji w różnych okolicznościach (np. w porze godów vs. w sytuacji obrony terytorium).

Po trzecie, rosnące zainteresowanie medialne i finansowe wsparcie. Coller-Dolittle Prize oferuje nawet pół miliona dolarów za "udowodnione nawiązanie dwukierunkowej komunikacji" z obcym gatunkiem. Choć brzmi to jak fantastyka naukowa, takie budżety motywują różnorodne zespoły do współpracy i do przekraczania kolejnych barier technicznych.

Jesteśmy świadkami niezwykłego zjawiska: ciężkie do pozyskania pieniądze badawcze trafiają do odważnych projektów i to może pchnąć całą dyscyplinę do przodu
zauważa jeden z recenzentów konkursu.
Psy pomagają tropić dziki zakażone ASFPolsat NewsPolsat News
Masz sugestie, uwagi albo widzisz błąd?
Dołącz do nas