Szukam, więc jestem

Mikołaj Leszczuk,teleinformatyk: Wyszukiwarce najtrudniej odgadnąć, czego tak naprawdę poszukujemy.

02.09.2008

Czyta się kilka minut

Mikołaj Leszczuk / fot. Michał Kuźmiński /
Mikołaj Leszczuk / fot. Michał Kuźmiński /

Michał Kuźmiński: Wpisuje Pan czasem własne nazwisko w Google?

Mikołaj Leszczuk: Tak. Wiem, że czasem szukają mnie studenci, i sprawdzam, czy trafiają na wartościowe wyniki.

Ja się w ten sposób dowiedziałem, że w 2006 r. napisał Pan doktorat o sposobach dostępu przez sieć do cyfrowych zasobów, że pracował Pan przy kilku europejskich projektach telekomunikacyjnych, że jest Pan wikipedystą i zadaje studentom opracowanie haseł do tej sieciowej encyklopedii. Ale znalazłem Pana nazwisko też w wynikach zawodów ju-jitsu w Olkuszu.

Ju-jitsu to już nie o mnie.

Ale ten ostatni wynik obrazuje niedoskonałości wyszukiwarek.

Czy ja wiem? Większość użytkowników klika w pierwsze dwa-trzy linki. Wykres pokazujący korzystanie z kolejnych wyników to ostro spadająca krzywa. Ważne, żeby być w pierwszych trzech.

Dlaczego myśląc "wyszukiwanie", mówimy "Google"?

Tak jest w Polsce i w Europie, nad czym zresztą ubolewa Komisja Europejska, bo to monopol, w dodatku amerykański. Od pewnego czasu mówi się więc o europejskim projekcie wyszukiwarki Quaero (po łacinie "szukam" - pisownię najlepiej sprawdzić... w Google). Komisja pompowała duże pieniądze w ten projekt, inspirowany głównie przez francuskie i niemieckie konsorcja. Mowa o wyszukiwarce konkurencyjnej do Google, a nawet idącej krok dalej: opierającej się nie tylko na słowach kluczowych, lecz także na treściach.

Co to znaczy?

Zwykle, gdy wyszukujemy w Google obiekty multimedialne - filmy, grafikę czy muzykę - system opiera się albo na słowach kluczowych: a więc np. nazwie pliku, albo na metadanych - czyli na opisie zawartym w pliku, który ktoś wpisał ręcznie - bądź wreszcie na sąsiedztwie tego obiektu na stronie internetowej - zakłada się, że tekst umieszczony w okolicy takiego obiektu ma z nim związek.

Co często prowadzi do zabawnych nieporozumień.

I można to ciekawie wykorzystywać do manipulowania wynikami wyszukiwania. Natomiast w wyszukiwaniu opartym na treści system próbuje zanalizować sam obraz: jeśli na dole pliku graficznego jest kolor żółty, a na górze niebieski, to zdjęcie najpewniej przedstawia plażę.

Albo flagę Ukrainy.

Dziś są to techniki bardzo niedokładne. Ale przede wszystkim systemowi najtrudniej odgadnąć, czego my, użytkownicy, tak naprawdę poszukujemy. Żeby wyrazić precyzyjnie, czego poszukujemy, musielibyśmy wypełniać potężne ankiety. Tymczasem wpisujemy "słońce plaża morze" i liczymy, że wyszukiwarka znajdzie odpowiedź, którą wcześniej sobie wyobraziliśmy. Problem w tym, że ona jeszcze tego nie umie. Człowiek, poprzez pewne wspólne mianowniki kulturowe, widzi pod pojęciem "plaża" konkretny obraz. Dla wyszukiwarki to niemożliwe.

Co więcej, wobec wyszukiwarki pozostajemy anonimowi. Gdy wpiszemy hasło "niewierny", nie wiadomo, czy szukamy muzułmanina, czy chrześcijanina. To, co dla wyszukującego oczywiste, dla wyszukiwarki jest obce.

Pewnym rozwiązaniem jest tzw. GeoIP: na podstawie adresu internetowego można z pewnym przybliżeniem - do kraju, czasem miasta - zorientować się, kto pyta.

Jeśli wpiszę słowo "hydraulik", zobaczę adresy hydraulików nie w Krzemowej Dolinie, lecz w Krakowie?

Przynajmniej w Polsce.

Jak wyszukiwarka może zgadywać nasze intencje? Opisano słynny "paradoks Paris Hilton"...

...gdzie nie wiadomo, czy szukamy hotelu Hiltona w Paryżu, czy osoby. Tu pojawia się drugie rozwiązanie: konstruowanie naszego profilu. Wyszukiwarka... śledzi użytkownika. Trzeba go przekonać, żeby w systemie typu "Google" założył własne konto. Najprościej - oferując mu dodatkowe usługi, jak poczta, do których musi się logować. Jeśli raz to zrobi - za każdym razem wchodząc z danego komputera na stronę wyszukiwarki, będzie przez nią rozpoznawany. Przykładowo: jeśli często rezerwujemy przez internet hotele, większa szansa, że wpisując "Paris Hilton", znajdziemy hotel. Jeśli zwykle szukamy plotek - wyniki pokażą celebrytkę. Google potrafi też analizować, co robimy w innych jego usługach (np. o czym zwykle piszemy w mailach), i skojarzyć to z wynikami wyszukiwania.

Więc gromadzona jest ogromna wiedza o mnie... skóra cierpnie.

To dziś standard i nie ma się co przerażać, że obok naszych e-maili wyświetlają się reklamy kontekstowe, zgodne z treścią naszej prywatnej poczty. Godzimy się na to, zakładając konto pocztowe - ale kto czyta umowy licencyjne wyświetlane przy logowaniu?

Powiedział pan, że wyszukiwarka

jeszcze nie umie sobie wyobrazić ideału plaży. Czy wyszukiwarki będą sobie kiedyś potrafiły poradzić, gdy użytkownik sam nie wie, czego chce?

Tu pewnym rozwiązaniem mogą być technologie Query by Example, czyli "zapytanie przez przykład". Zamiast wpisywać pytanie, pokazujemy wyszukiwarce obraz, który mniej więcej przedstawia to, o co nam chodzi - np. gdy znaleźliśmy obrazek prawie idealny, ale jeszcze nie doskonały. Albo szkicujemy wyszukiwarce model, a system próbuje wyszukać podobne obrazy.

To samo może dotyczyć dźwięku: usłyszeliśmy w radiu melodię, która się nam spodobała, ale nie wiemy, co to jest. Można ją będzie wyszukiwarce... zanucić. Oprogramowanie analizuje ścieżkę dźwiękową i dopasowuje do wzorca ze swojej bazy.

W nowoczesnych filmach szpiegowskich oglądamy np. ośrodek CIA, gdzie ktoś wrzuca do komputera zdjęcie z kamery przemysłowej i otrzymuje komplet fotografii i danych tej osoby. Czysta fantazja?

Nie. Rozpoznawanie twarzy działa już dość dobrze. Jeśli dostarczymy systemowi fotografie grupy osób, po kilka zdjęć dla każdej z nich, system w 99 procentach będzie nas umiał zidentyfikować na kolejnym. Problem w tym, skąd wziąć pierwszych dziesięć zdjęć, skąd wiedzieć, że jest na nich dana osoba i co, gdy osób nie jest dziesięć, lecz dziesięć tysięcy. Pierwszy problem jest łatwy w przypadku osób znanych - np. celebrities albo przestępców. Gorzej w przypadku zwykłych ludzi. Problem dużej bazy jest prostszy, wystarczy odpowiednia moc komputera. W Katedrze Telekomunikacji AGH prowadzimy badania nad takimi systemami.

Skąd system wie, że widzi twarz?

Każda twarz ma kilka stałych elementów: oczy, usta, nos. Oczywiście, użytkownik może zaznaczyć na zdjęciu twarz, ale często musi się to dziać w czasie rzeczywistym - np. w tłumie na lotnisku. Takie systemy już działają. Nie są nieomylne, ale niezłe.

A jeśli nasz przestępca nie ma oka?

Problemy są prostsze: np. gdy twarz jest lekko obrócona lub zasłonięta. Na szczęście zwykle obraz pochodzi z filmu i da się wybrać klatkę, gdzie twarz jest dobrze widoczna.

Jakie jeszcze zastosowania oprócz policyjnych może mieć wyszukiwanie obrazu?

Zaczynamy właśnie wdrażać wyszukiwanie podobnych obrazów wśród dzieł sztuki. Znajdujemy zdjęcie interesującego nas malowidła czy rzeźby, a system szuka najbardziej podobnych.

Czy da się stworzyć wyszukiwarkę, której można zadać pytanie naturalnym językiem, a nie wpisując słowa kluczowe?

To działa dość prosto: system wyrzuca wszystkie formy pytające czy spójniki, zostawia rzeczowniki i korzysta z nich jako słów kluczowych. Dla użytkownika jest ważniejsze, czy w języku naturalnym otrzyma odpowiedź. A tak naprawdę otrzymujemy przecież nie odpowiedź na pytanie, lecz link do istniejącej strony.

Tymczasem pracuje się nad technologiami zdolnymi do generowania raportu na zadany temat na podstawie źródeł znalezionych w sieci.

Dziś to najczęściej oparte na... pracy ludzi.

Jestem zawiedziony.

To rodzaj consultingu: zlecamy komuś opracowanie raportu, a jego wykonawca siada do Google’a.

Czy możliwe jest, by program przygotował nam streszczenie "Zbrodni i kary"?

Są takie próby. Ale streszczanie nie jest łatwe z dwóch powodów. Po pierwsze, by tekst streścić, trzeba go zrozumieć. Po drugie - nie wiadomo, czy jest na to rynkowe zapotrzebowanie. Technicznie rzecz biorąc, na pytanie, ile medali zdobyła Polska w Pekinie, moglibyśmy otrzymać raport wygenerowany przez wyszukiwarkę. Ale w sieci już istnieje kilkadziesiąt stron z odpowiedzią - w dodatku zwykle też z komentarzem, dlaczego tak mało.

To pocieszające, że na końcu jest jednak człowiek, nie maszyna.

Ale też człowiek nie ma wygórowanych wymagań. Często wdraża się usługi po to, by wykreować pod nie rynek. 10 lat temu niewiele osób widziało potrzebę posiadania telefonu komórkowego.

Tyle że akurat w przypadku wyszukiwarek potrzeba była ogromna: pozwoliły nam ogarnąć chaotyczną sieć.

Oczywiście - był to problem, który wręcz hamował rozwój internetu. Przypadkiem odwrotnym jest np. "Nasza klasa": ludzie nie potrzebowali utrzymywać kontaktów ze znajomymi z podstawówki. A gdy powstała usługa, nagle się okazało, jak nieodzowne jest, by wyszukać Franka z 1B.

...i powstała wyszukiwarka starych znajomych. Czego jeszcze będziemy chcieli szukać, tyle że jeszcze o tym nie wiemy?

Danych z naszych komputerów. Dziś każdy może kupić tani dysk o pojemności terabajta i bardzo szybko zapełnia go zdjęciami czy filmami. Oczywiście nie każdy chce się nimi potem dzielić, ale wiele osób chce, lecz pojawia się trudność ich znalezienia. Zdjęcia, które zrobiłem na wycieczce, nie znajdę w Google, a dla innego użytkownika może to być właśnie owo zdjęcie idealne. To właśnie tu, w tzw. systemach Peer-to-Peer, widzę wciąż ogromny potencjał. Sprawdziłyby się tu wspomniane technologie Query by Example - nie można od zwykłego użytkownika wymagać, by szczegółowo opisał swoje zasoby. To system musi o to zadbać.

Czy dzięki systemowi globalnego lokalizowania - GPS - będziemy mogli szukać także obiektów rzeczywistych?

To się już dzieje. Istnieje np. system geotagowania fotografii - zdjęcie opisane jest współrzędnymi miejsca, w którym zostało wykonane. Ostatnio pojawiły się wreszcie aparaty z GPS-em, które geotagują fotografie automatycznie. To spóźniony produkt, bo technicznie rzecz jest prosta, a odbiornik - mały. Ale odbiorniki GPS można montować w każdym urządzeniu komunikacyjnym.

Dzięki takim systemom można by sprawdzić, czy tam, gdzie jestem, odbywa się ciekawy koncert czy wystawa.

Przymierzają się do tego miejskie wydziały promocji i turystyki, opracowywaliśmy już raz taką wstępną koncepcję. Pracuje się dziś nad systemami, które do urządzenia mobilnego dostarczałyby informacji na bazie jego pozycji. Problem w tym, że wtedy potrzebny jest content, czyli treści. Mamy zaawansowane technologie do przekazywania czy wyszukiwania, ale często brakuje ciekawych rzeczy, które można by wyświetlić czy znaleźć.

Derrick de Kerckhove, teoretyk i wizjoner mediów, przewidywał, że cała ta moc łączności zmobilizuje do tworzenia treści samych użytkowników. Nie urząd promocji będzie ich dostarczał, lecz np. blogerzy.

Dobrym przykładem jest mechanizm ostrzegania przed fotoradarami w systemie nawigacyjnym AutoMapa. Kierowcy, gdy zobaczą fotoradar, za pomocą jednego przycisku mogą zgłosić to miejsce, a system zapisuje ich pozycję GPS i synchronizuje ją z bazą ogólnopolską.

Ale w innych sytuacjach problem jest społeczny, nie techniczny. Istnieje prawo, które użytkowników sieciowych serwisów oddolnych (jak choćby Wikipedia) dzieli w proporcjach 90-9-1: 1 proc. generuje zdecydowaną większość treści. 9 proc. robi to sporadycznie, 90 proc. wyłącznie z nich korzysta. W przypadku fotoradarów te 1 proc. może być sporą liczbą ludzi. Ale w przypadku informacji kulturalnych - niekoniecznie.

Jednak ostatecznym problemem dzisiejszych urządzeń mobilnych nie jest GPS ani nawet łączność z siecią. Jest on dużo banalniejszy: zasilanie.

Cała ta technologia może się rozbić o baterię?

Właśnie. Baterie już się raczej nie rozwiną. Kupując nowy telefon komórkowy, musimy się liczyć z tym, że trzeba cały czas nosić przy sobie ładowarkę.

Jak powinna wyglądać wyszukiwarka idealna?

Po pierwsze - kontakt z użytkownikiem. Dziś próbuje się budować interfejsy, które nie sprowadzają się do klawiatury i myszki. Pamięta pan film "Raport mniejszości"? Mamy tam wirtualną trójwymiarową tablicę, która daje wrażenie sięgania, przesuwania, powiększania, odrzucania - czyli czynności naturalnych w wyszukiwaniu. Namiastką takiego interfejsu jest choćby dotykowy ekran iPhone’a.

Po drugie - personalizacja, ale nie za pomocą kłopotliwych kwestionariuszy, lecz na bazie prób domyślania się tego, czego naprawdę poszukuję.

Po trzecie - samo wyszukiwanie musi się odbywać nie tylko przez tekst, lecz przez inne media i sięgać nie tylko do serwerów, lecz i do zasobów rozproszonych. Mówiliśmy o zdjęciach w komputerach osobistych - a ile zdjęć zalega w naszych telefonach? Chcielibyśmy je udostępnić, a często nie umiemy lub się nam nie chce.

Wyobraża Pan sobie wyszukiwarkę, która znając moje preferencje, zwyczaje i lokalizację, podpowie mi pomysł, co mógłbym zrobić sobie na obiad?

Bałbym się sytuacji, w której wyszukiwarka jest na tyle przekonująca, że użytkownik bezgranicznie wierzy w znalezioną informację. Im szerzej sięgamy po treści generowane oddolnie, przez anonimowych użytkowników, tym mniejszą mamy kontrolę nad jakością. W pana przykładzie grozi nam najwyżej niesmaczny obiad. A jeśli ktoś szuka porad medycznych?

Dr inż. MIKOŁAJ LESZCZUK (ur. 1976) jest adiunktem w Katedrze Telekomunikacji Akademii Górniczo-Hutniczej w Krakowie. Zajmuje się m.in. technikami wyszukiwania treści audiowizualnych, multimediami, internetowymi systemami medycznymi. Autor ok. 50 publikacji naukowych, od 2000 r. członek Institute of Electrical and Electronics Engineers (IEEE).

Dziękujemy, że nas czytasz!

Wykupienie dostępu pozwoli Ci czytać artykuły wysokiej jakości i wspierać niezależne dziennikarstwo w wymagających dla wydawców czasach. Rośnij z nami! Pełna oferta →

Dostęp 10/10

  • 10 dni dostępu - poznaj nas
  • Natychmiastowy dostęp
  • Ogromne archiwum
  • Zapamiętaj i czytaj później
  • Autorskie newslettery premium
  • Także w formatach PDF, EPUB i MOBI
10,00 zł

Dostęp kwartalny

Kwartalny dostęp do TygodnikPowszechny.pl
  • Natychmiastowy dostęp
  • 92 dni dostępu = aż 13 numerów Tygodnika
  • Ogromne archiwum
  • Zapamiętaj i czytaj później
  • Autorskie newslettery premium
  • Także w formatach PDF, EPUB i MOBI
89,90 zł
© Wszelkie prawa w tym prawa autorów i wydawcy zastrzeżone. Jakiekolwiek dalsze rozpowszechnianie artykułów i innych części czasopisma bez zgody wydawcy zabronione [nota wydawnicza]. Jeśli na końcu artykułu znajduje się znak ℗, wówczas istnieje możliwość przedruku po zakupieniu licencji od Wydawcy [kontakt z Wydawcą]
Zastępca redaktora naczelnego „Tygodnika Powszechnego”, dziennikarz, twórca i prowadzący Podkastu Tygodnika Powszechnego, twórca i wieloletni kierownik serwisu internetowego „Tygodnika” oraz działu „Nauka”. Zajmuje się tematyką społeczną, wpływem technologii… więcej

Artykuł pochodzi z numeru TP 36/2008