S01E07 [Utracona prywatność] — Jak firmy zarabiają na Twoich metadanych?

„Z rzeczy istniejących jedne są od nas zależne, inne niezależne.” — Epiktet, Encheiridion

Treść jest głośna.
Metadane są ciche.

Treść trzeba przeczytać, zrozumieć, zinterpretować.
Metadane wystarczy policzyć.

I dlatego to nie treść jest dziś najcenniejsza.
Najcenniejszy jest kontekst, który powstaje mimochodem — nawet wtedy, gdy nie publikujesz, nie piszesz, nie nagrywasz i nie mówisz.

Czym naprawdę są metadane — głębiej niż „dane o danych”

W podręcznikach przeczytasz, że metadane to „dane o danych”.
To prawda, ale to definicja tak płytka, że właściwie nic nie mówi.
Może o to chodzi, bo po co drążyć temat?

W praktyce metadane to:

  • czas (kiedy coś robisz),
  • częstotliwość (jak często),
  • intensywność (jak długo),
  • lokalizacja (gdzie),
  • trajektoria (skąd i dokąd),
  • relacje (z kim),
  • urządzenie (na czym),
  • sekwencja (w jakiej kolejności),
  • odchylenia (co jest nietypowe),
  • korelacje (co występuje razem).

To nie są „dodatki” – to jest matematyczny opis Twojego życia.

I co najważniejsze: metadane powstają zawsze, nawet jeśli treść nie powstaje nigdy.

Jak powstają metadane — warstwa po warstwie

Każde urządzenie, które łączy się z siecią, generuje metadane w kilku równoległych warstwach:

Warstwa 1 — sieć (IP, routing, BTS, TTL) Tu powstają informacje o:

  • Twojej lokalizacji,
  • Twoim operatorze,
  • Twojej prędkości przemieszczania,
  • Twojej strefie czasowej,
  • Twojej aktywności w czasie.

To jest poziom, którego nie da się wyłączyć.
To jest fundament internetu.

Warstwa 2 — urządzenie (IMEI, MAC, sensory) Tu powstają informacje o:

  • modelu smartfona,
  • stanie baterii,
  • orientacji urządzenia,
  • ruchu (akcelerometr, żyroskop),
  • sile sygnału,
  • pobliskich sieciach Wi-Fi.

Twój smartfone wie, czy biegniesz, jedziesz, siedzisz, śpisz, czytasz, czy tylko odblokowałeś ekran „na sekundę”.

Warstwa 3 — aplikacje (API calls, request headers) Tu powstają informacje o:

  • tym, z jakich aplikacji korzystasz,
  • jak często,
  • o której godzinie,
  • jak długo,
  • w jakiej kolejności.

Aplikacje nie muszą wiedzieć, co robisz.
Wystarczy, że wiedzą kiedy i jak.

Warstwa 4 — zachowanie (pattern analysis) To najcenniejsza warstwa.
Tu powstaje:

  • Twój rytm dnia,
  • Twoje nawyki,
  • Twoje anomalie,
  • Twoje relacje,
  • Twoje podatności.

To nie są dane.
To jest sygnatura człowieka.

Fingerprinting — identyfikacja bez ciasteczek

Gdy przeglądarki zaczęły blokować cookies, firmy nie zrezygnowały z identyfikacji.
Przerzuciły się na fingerprinting — technikę, która tworzy unikalny „odcisk palca” Twojego urządzenia.

Składa się na niego m.in.:

  • rozdzielczość ekranu,
  • czcionki,
  • sterowniki,
  • GPU,
  • wersja systemu,
  • język,
  • strefa czasowa,
  • kolejność renderowania elementów,
  • mikroopóźnienia procesora.

Fingerprinting jest tak skuteczny, że potrafi rozpoznać Cię nawet wtedy, gdy:

  • wyczyścisz historię,
  • zmienisz IP,
  • użyjesz VPN,
  • otworzysz okno incognito.

To nie jest „śledzenie”. To jest rozpoznawanie.

Korelacja — najpotężniejsze narzędzie analityczne świata

Metadane są jak pojedyncze nuty.
Dopiero korelacja tworzy z nich melodię.

Przykład:

Twój telefon loguje się do BTS-a o 6:42.

O 6:44 loguje się drugi telefon.

O 7:03 oba urządzenia przemieszczają się razem.

O 17:12 znów są w tym samym miejscu.

System nie musi znać treści Waszych rozmów.
Wie, że mieszkacie razem.

To samo działa dla:

  • współpracowników,
  • kochanków,
  • aktywistów,
  • dziennikarzy,
  • informatorów,
  • klientów,
  • polityków.

Korelacja to matematyka relacji.

RTB — aukcje Twojej uwagi i Twojego profilu

RTB (Real-Time Bidding) to system, w którym Twoje metadane są sprzedawane w czasie rzeczywistym, zanim strona zdąży się załadować.

Wysyłane są setki parametrów:

  • lokalizacja,
  • model urządzenia,
  • historia aktywności,
  • przewidywany dochód,
  • stabilność finansowa,
  • prawdopodobieństwo zakupu,
  • ryzyko kredytowe,
  • podatność na impuls.

To nie jest reklama.
To jest aukcja Twojej przyszłości.

Co można wywnioskować z samych metadanych — bez treści

Z samych metadanych można określić:

  • czy jesteś w związku,
  • czy masz depresję,
  • czy zmieniasz pracę,
  • czy masz problemy finansowe,
  • czy chorujesz,
  • czy jesteś w ciąży,
  • czy masz romans,
  • czy jesteś w grupie ryzyka,
  • czy planujesz wyjazd,
  • czy jesteś podatny na manipulację.

To nie są teorie.
To są modele predykcyjne, które działają na poziomie populacji, a potem dopasowują jednostkę.

Dlaczego metadane są cenniejsze niż treść

Treść jest chaotyczna.
Treść trzeba analizować.
Treść trzeba rozumieć.

Metadane są:

  • czyste,
  • strukturalne,
  • przewidywalne,
  • łatwe do korelacji,
  • łatwe do automatyzacji,
  • łatwe do sprzedaży.

Treść mówi, co powiedziałeś.
Metadane mówią, kim jesteś.

Modele predykcyjne a modele kształtujące człowieka

Dane przestają być tylko obserwacją.
Zaczynają być środowiskiem.

W przeszłości dane zbierane były tylko do analizy.
Kolejnym etapem był pomysł wykorzystania danych do tworzenia modeli i przewidywania decyzji.
Od niedawna dane przekuwa się w model i zmienia warunki, w których decyzja powstaje.

Pojawiają się inne treści, ceny, opcje, inne rzeczy są wyróżniane, a inne z kolei ukrywane.
Decyzja nadal należy do użytkownika, ale przestrzeń decyzji została wcześniej ukształtowana.

W pierwszym modelu system opisuje człowieka.
W drugim współtworzy człowieka.
A w trzecim projektuje warunki, w których człowiek podejmuje decyzje, a potem uczy się z tych decyzji.

Bo system nie tylko przewiduje decyzje — zaczyna zmieniać warunki, w których te decyzje powstają.

Człowiek przestaje być tylko obserwowany.
Zaczyna być modelowany, a potem stopniowo dostosowywany do modelu.

Najważniejsza prawda o metadanych

Metadane nie opisują tego, co robisz.
Opisują to, co prawdopodobnie zrobisz.

Nie są więc zapisem przeszłości.
Są projekcją przyszłości.

I właśnie dlatego są tak cenne — bo pozwalają systemom działać zanim Ty podejmiesz decyzję.

Nie muszą znać Twojej treści.
Wystarczy, że znają Twój cień.

System nie tylko opisuje człowieka. Zaczyna go odtwarzać w wersji przewidywalnej.