Czym jest Era Post-Cookie?
Cookies – jak działają ciasteczka w przeglądarkach?
Regulacje unijne w zakresie prywatności użytkowników
Dane online w biznesie – jak je wykorzystywać?
Jak zbierać dane w Erze Post-Cookie?
Privacy Sandbox
Enhanced Conversions
Consent Mode v2
Behavioral modeling
Podsumowanie
Wyobraźmy sobie idealny świat danych online, w którym centrum uwagi stanowi użytkownik. W tym świecie możemy wiedzieć o użytkowniku praktycznie wszystko. Skąd pochodzi, co robi w naszych produktach cyfrowych, jakie ma preferencje zakupowe i jaka jest jego historia zakupowa w naszym serwisie. Tę wiedzę ogranicza tylko nasza wyobraźnia w jej wykorzystaniu. Możemy optymalizować reklamy, kreacje, teksty, serwis, checkout, a nawet zarządzać magazynem.
Świat danych online jest dostępny tu i teraz, co pozwala na bieżąco korzystać z informacji, które dostarcza. Jednak jakość dostępnych danych zaczyna być rozmyta przez regulacje dotyczące zbierania danych personalnych użytkowników w serwisie.
Przed omówieniem sposobów na utrzymanie wysokiej jakości danych online, warto zdefiniować, dlaczego era cookie jest tak istotna.
Ciasteczka odgrywają kluczową rolę w świecie online i jakości danych. Świat online jest bezstanowy (stateless), co oznacza, że każda interakcja użytkownika z serwisem internetowym jest niezależna od poprzednich. Ciasteczka pozwalają na śledzenie tych interakcji, co umożliwia zbieranie i analizowanie danych. Jak więc wyobrazić sobie analitykę internetową bez nich?
W kontekście e-commerce, jakość danych jest niezwykle ważna. Dzięki precyzyjnym danym firmy mogą lepiej zrozumieć zachowania swoich klientów, optymalizować kampanie marketingowe i podejmować bardziej trafne decyzje biznesowe.
Porównanie do motoryzacji może być bardzo pomocne w zrozumieniu roli ciasteczek w analityce online. Wyobraź sobie, że wracasz do domu i wsiadasz do samochodu, a wszystkie ustawienia – lusterka, fotel, kierownica, tryb jazdy, a nawet adres domowy w nawigacji – są wyzerowane.
Za każdym razem, gdy wsiadasz do samochodu, musisz je ponownie dostosować.
W praktyce, jeśli masz jeden samochód, a korzystasz z niego z partnerem, każdy z was ma swój kluczyk, do którego przypisane są indywidualne ustawienia samochodu. Ten kluczyk jest odpowiednikiem ciasteczka w świecie danych online. Kiedy korzystasz z serwisu internetowego, dodajesz coś do koszyka, logujesz się, a potem wracasz do tego serwisu, produkty nadal są w koszyku.
Jeśli przechodzisz ze strony karty produktu do dodania do koszyka, a następnie do checkoutu, aby dokończyć zakup, ciasteczko jest niezbędne w bezstanowym świecie, aby przenieść te informacje między poszczególnymi podstronami. Można zadać pytanie, skoro ciasteczka są tak pożyteczne, dlaczego zaczynamy rozmawiać o erze Post-Cookie, w której ciasteczka będą ograniczone lub nieobecne.
W praktyce technologicznie dzielimy ciasteczka na pierwszej i trzeciej kategorii. Ważniejsze jest jednak zrozumienie, jak Unia Europejska i legislacja patrzą na ciasteczka. Są one postrzegane jako niezbędne, czyli takie, bez których serwis nie może działać. Na przykład, jeśli nie byłoby ciasteczek, dodając produkt do koszyka, nie moglibyśmy dokończyć zakupów, ponieważ serwis nie pamiętałby, że produkty zostały przez nas do niego dodane. Niestety, z perspektywy osób zajmujących się danymi, większość ciasteczek jest uznawana za zbędne. Ciasteczka analityczne i marketingowe odgrywają kluczową rolę w zrozumieniu, jak użytkownicy korzystają z witryn internetowych oraz w dostarczaniu spersonalizowanych reklam. Aby lepiej zrozumieć ich znaczenie i podejście Unii Europejskiej do tych narzędzi, warto przyjrzeć się przykładowemu scenariuszowi.
Wyobraźmy sobie, że jesteśmy na portalu Onet i widzimy reklamę. Ta reklama jest dostarczana przez jednego z większych dostawców, takich jak Google Marketing Platform, który oferuje zestaw narzędzi, w tym Google Ads, za pośrednictwem którego serwowane są reklamy. W momencie kliknięcia na reklamę tworzone jest ciasteczko, a sygnał o tym zdarzeniu jest wysyłany do chmury. Informacja o kliknięciu jest przypisana do użytkownika na podstawie tego ciasteczka.
Następnie użytkownik odwiedza stronę modivo.pl. Dzięki ciasteczkom, reklamodawcy mogą śledzić aktywność użytkownika i dostarczać mu bardziej spersonalizowane treści. W Polsce wiele firm korzysta z narzędzi analitycznych, które śledzą aktywność użytkowników na stronach internetowych. Przykładem może być sytuacja, w której użytkownik odwiedza stronę Modivo, a narzędzie analityczne tworzy ciasteczko, które identyfikuje go jako powracającego użytkownika przy kolejnych wizytach. Załóżmy, że podczas tej wizyty użytkownik nie dokonuje żadnej interakcji na Modivo.
Po pewnym czasie użytkownik wraca na Onet, aby przeczytać artykuł. Google Marketing Platform, dzięki ciasteczku, rozpoznaje, że użytkownik wcześniej odwiedził Modivo i oglądał konkretne produkty. W efekcie może zostać wyświetlona reklama przypominająca o tych produktach. Tego typu reklamy są skuteczne, ponieważ przypominają użytkownikom o produktach, które wcześniej oglądali.
Kiedy użytkownik ponownie odwiedza Modivo, porusza się po serwisie i dokonuje zakupu, ciasteczko, które jest zwykle losowym numerem lub kombinacją numerów, identyfikuje użytkownika w danych jako ID. Dzięki temu możliwe jest np. kierowanie spersonalizowanych reklam w późniejszym czasie.
Unia Europejska podchodzi rygorystycznie do kwestii prywatności, ponieważ Google gromadzi ogromne ilości danych o użytkownikach. Śledzi to co oglądamy, co czytamy, co kupujemy, a nawet przechowuje dane finansowe, jeśli je tam zostawiamy. Logując się do Gmaila, podajemy swoje dane osobowe, co sprawia, że Google ma dostęp do szerokiego zakresu informacji.
Unia Europejska planuje w przyszłości bardziej chronić użytkowników w internecie.
Historia tego procesu sięga 2002 roku, kiedy to wprowadzono dyrektywę e-privacy, mającą na celu ochronę danych. W praktyce była to jedynie deklaracja na papierze. Zmiany zaczęły się w 2009 roku, około 10 lat po rewolucji internetowej. W serwisach pojawiły się paski informujące o używaniu ciasteczek, które jednak niewiele wnosiły w kontekście e-privacy i nie wpływały na użytkowników, jedynie obniżając użyteczność serwisów.
Prawdziwe zmiany zaczęły się w ciągu ostatnich 4-5 lat, począwszy od 2019 roku. Wtedy to wyrok Trybunału Sprawiedliwości Unii Europejskiej przekształcił się w wytyczne Europejskiej Rady Ochrony Danych Osobowych. Serwisy internetowe muszą teraz pozyskiwać zgody użytkowników na wykorzystywanie ciasteczek, nie tylko informować o ich obecności. W związku z tym zaczęły pojawiać się platformy zarządzania zgodami na ciasteczka (cookie management platforms), które zarządzają i pozyskują zgody użytkowników.
Wśród tych platform często pojawia się decyzja, jakie rodzaje ciasteczek można wykorzystywać. Z perspektywy danych statystycznych i marketingowych, istotne są wszystkie ciasteczka. Co więcej, RODO wymaga, aby zgody były pozyskiwane w sposób aktywny, czyli użytkownik musi wyrazić chęć na wykorzystanie ciasteczek. Musi istnieć możliwość łatwego wycofania zgody, a także nie można stosować tzw. dark patterns, czyli technik manipulacyjnych, takich jak ukrywanie przycisku „zrezygnuj ze wszystkich” czy manipulowanie kolorami przycisków.
W 2023 roku Digital Markets Act wprowadził istotne zmiany w kontekście wykorzystania ciasteczek, co miało duży wpływ na świat danych. Brak identyfikatora powoduje, że dane stają się mniej kontekstowe. Bez ID wizyta nie może być połączona między podstronami czy różnymi okresami czasu, co utrudnia rozpoznanie użytkownika. Biznes, zwłaszcza marketing online, bardzo potrzebuje tych danych. Brak ciasteczek prowadzi do problemu określanego jako „Garbage In, Garbage Out”.
Współpracując z e-commerce’ami i firmami działającymi online, pomagamy wykorzystać dane w trzech głównych kontekstach. Każdy biznes powinien wykorzystywać dane dotyczące:
W praktyce głównym źródłem prawdy jest hurtownia danych, którą zarządza wiele firm w kontekście analityki internetowej. Jednym z kluczowych narzędzi jest Google Analytics, który, prawidłowo skonfigurowany, powinien pokazywać około 85% rzeczywistości rynkowej. Te 15% wynika z faktu, że część osób ma zablokowane ciasteczka, zwłaszcza użytkownicy świadomi technologicznie. W serwisach technologicznym różnice te mogą być znacznie większe.
W e-commerce, zwłaszcza w branży fashion, różnice te nie powinny przekraczać 10%, co oznacza, że 90% danych powinno być dostępnych. Jednak w dobie zmian, które zaczęły się około 2019 roku, tracimy coraz więcej danych w marketingu online. Straty te mogą sięgać nawet 50%.
Jakie są więc rozwiązania? Jak funkcjonować w świecie post-cookie, aby zachować jakość danych i skutecznie wspierać marketing oraz biznes?
Pierwszym rozwiązaniem, które przygotowuje rynek, a konkretnie Google, jest tak zwane Privacy Sandbox. Jest to zestaw różnych rozwiązań, w tym Protected Audience API. Zamiast ciasteczek trzeciej kategorii, które przenoszą informacje o aktywności użytkownika między stronami (np. ktoś widział buty na Modivo, a później widzi te same buty w reklamie na Onecie), teraz przeglądarka będzie decydowała o wyświetlaniu reklamy na podstawie historii poruszania się użytkownika. Jakość dopasowania może być niższa, ponieważ istnieje szansa, że obok Modivo pojawią się również CCC, Answear lub inne sklepy z branży fashion.
Tak zwane ciasteczka reklamowe trzeciej kategorii są coraz częściej blokowane przez przeglądarki. Polecam serwis cookiestatus.com dla osób zainteresowanych tym tematem.
Obecnie wszystkie przeglądarki, z wyjątkiem Chroma, blokują te ciasteczka, co uniemożliwia remarketing na tych przeglądarkach. Na szczęście, Chrome nadal ma ponad 60% udziału w rynku przeglądarek w Polsce, co sprawia, że ten problem nie jest jeszcze tak dotkliwy dla marketingu online. Chrome regularnie przesuwa datę wprowadzenia blokady ciasteczek trzeciej kategorii. Pierwotnie planowano to na 2022 rok, ale testy blokowania na 1% użytkowników w 2024 roku wykazały potrzebę dalszych opóźnień.
W Erze Post-Cookie musimy przygotować się na te zmiany i liczyć na to, że rozwiązania będą tak dopracowane, że jakość naszych działań marketingowych nie ucierpi znacząco. W kontekście działań, które możemy wdrożyć wewnętrznie w firmach, kluczowe jest przypisywanie reklam do generowanych efektów. Przykładowo, płacąc za miejsce reklamowe na Onecie, oczekujemy, że zobaczymy, jaki efekt przynosi ta inwestycja. Jednym z rozwiązań stosowanych w branży są Enhanced Conversions od Google oraz Conversion API od Mety.
Enhanced Conversions działają w ten sposób, że jeśli użytkownik ogląda reklamy, będąc zalogowanym do Gmaila, Google Marketing Platform wie, że użytkownik X widział daną reklamę. W przypadku braku ciasteczek, wdrożenie Enhanced Conversions polega na przesyłaniu zahashowanego e-maila wraz z transakcją. Podczas transakcji e-mail musi być podany, aby mogło zostać wysłane potwierdzenie i status samej transakcji. Google, otrzymując zahashowany e-mail, jest w stanie dopasować dane i poprawić jakość przypisania konwersji.
Poprawa jakości przypisania konwersji dzięki Enhanced Conversions wynosi średnio 17% w przypadku reklam wideo oraz 5% w przypadku reklam Google Ads. Oznacza to, że rzeczywisty przychód z transakcji jest właściwie przypisany, a nie błędnie, do innego źródła ruchu. Enhanced Conversions polegają więc na wysyłaniu zahashowanych danych personalnych, co znacząco poprawia dokładność analizy efektywności reklam.
Kolejnym rozwiązaniem na ubytki w danych jest to Consent Mode. Consent Mode uzupełnia dane na podstawie informacji bez ID użytkowników. Aby wdrożyć to rozwiązanie, najważniejszy jest pierwszy element — cookie management platform. Bez tego nie będziemy wiedzieli, jaką zgodę użytkownik wyraził.
Działa to w ten sposób, że jeśli użytkownik wyrazi zgodę na ciasteczka (stan granted), wszystko działa jak w świecie ciasteczkowym i nie ma problemu. W erze cookie versus post-cookie nic się tutaj nie zmienia. W erze post-cookie, kiedy użytkownik nie wyraża zgody, każda interakcja wysyła tzw. pingi. Ping to paczka informacji, która nie zawiera ID użytkownika. Istnieje również trzeci stan – brak zgody. To kluczowa zmiana, która znacząco wpłynęła na marketing online. Wydawcy nie mogą przetwarzać danych, jeśli użytkownik nie podjął żadnej decyzji dotyczącej wykorzystania ciasteczek.
Digital Market Act (DMA) wprowadził nowe regulacje, które Google zauważył po wytycznych RODO z 2020 roku. Okazało się, że firmy nie wdrażają skutecznie zarządzania ciasteczkami. W odpowiedzi na to, nałożono obowiązki na firmy przyjmujące dane. Wśród sześciu wyznaczonych firm znalazły się m.in. Google, Meta i Amazon. Przewidziano kary do 10% obrotu za przetwarzanie danych bez zgody użytkownika. 6 marca 2024 roku weszły w życie nowe przepisy dotyczące zarządzania plikami cookie i trybu constant mode.
Wiele firm, które nie wdrożyły tych zmian, zauważyło spadek ruchu i sprzedaży. Było to związane z tym, że mechanizmy marketingowe, takie jak Google Ads, które automatycznie optymalizują kampanie na podstawie machine learningu, potrzebują danych do działania. Gdy przepływ danych został przerwany, reklamy przestały się wyświetlać, co spowodowało spadek ruchu i przychodów.
Jednym z rozwiązań tego problemu jest modelowanie behawioralne, które wykorzystuje tzw. pingi. Pingi są wysyłane nawet wtedy, gdy użytkownik nie wyraził zgody na pliki cookie, dzięki wdrożeniu trybu constant mode. W praktyce oznacza to, że dane, które widzimy w systemach analitycznych, są estymowane na podstawie tych pingów.
Jako absolwent statystyki i ekonometrii, pamiętam, że modele ekonometryczne były całkiem skuteczne, choć tworzone w Excelu czy Matlabie. Dzisiaj, dzięki machine learningowi, dane są jeszcze bardziej precyzyjne. W erze Post-Cookie, mimo braku ciasteczek, możemy osiągnąć większe pokrycie danych w hurtowniach, sięgające nawet 85%. W hurtowniach danych, takich jak BigQuery, dane są ciągle aktualizowane.
Dzięki włączonemu trybowi consent mode, dane te są dostępne bez identyfikatora użytkownika, ale nadal można je przemodelować i wykorzystać, na przykład łącząc z danymi z platform mediowych i analitycznych. Często pełnimy rolę asystenta, tworząc hurtownie danych na potrzeby marketingu lub pomagając zarządzać nimi jako głównym źródłem prawdy. Uzupełniamy te hurtownie, poprawiając jakość danych.
Obecnie świat danych online staje się coraz bardziej złożony. Istnieją mechanizmy, które pomagają wyostrzyć obraz danych, choć nigdy nie będą tak dokładne jak w erze cookie. Warto przygotować się na najgorsze, wdrożyć przynajmniej tryb consent mode w wersji drugiej i liczyć na najlepsze rozwiązania, jakie branża reklamowa może w przyszłości zaoferować.

Historie sukcesów
Ostatnie wpisy na blogu