
Zanim przystąpimy do analizy danych, kluczowe jest to aby zadbać o same dane – a raczej ich jakość i kompletność. W analityce internetowej nie tylko o to, żeby mierzyć kluczowe wskaźniki i zdarzenia, lecz także o jakość danych, które wpadają do narzędzi analitycznych. Dlaczego? Nawet najbardziej dokładny tracking lejka sprzedażowego będzie bezużyteczny, jeśli nie będziemy w stanie zaufać danym, na których mamy polegać przy podejmowaniu decyzji biznesowych o nie opartych.
To właśnie parametr „(not set)” w Google Analytics 4 jest jednym z najpowszechniejszych oznak niedostatecznej jakości danych w GA4. Na szczęście, choć nie ma jednej określonej przyczyny, to zwykle jesteśmy w stanie istotnie ograniczyć występowanie tej wartości. Zacznijmy jednak od odpowiedzi na pytanie, czym jest parametr „(not set”) w Google Analytics.
Co oznacza wartość not-set w Google Analytics 4?
Przyczyny występowania wartości not-set w Google Analytics
Wpływ trybu zgody i śledzenia serwerowego na wartość „(not set)” w Google Analytics 4
Dlaczego eliminowanie braków danych jest takie istotne?
Jak ograniczyć rozbieżności w danych za pomocą zmian w rejestrowaniu transakcji
Podsumowanie
Zacznijmy od definicji, którą dostarcza nam oficjalna dokumentacja Google:
Wartość (not set) to nazwa symbolu zastępczego, który Google Analytics stosuje, gdy nie otrzyma z jakiegoś wymiaru (dimension) żadnych danych.
Wartość „(not set)” jest więc swego rodzaju „zaślepką” dla tych wyników, przy których z jakiegoś powodu brakuje wartości wymiaru. W wyjątkowych przypadkach jest to pożądana sytuacja.Nie musimy przecież stosować wszystkich 5 kategorii produktu dla e-commerce, więc te niewykorzystane będą prezentować właśnie wartość „(not set)”.

Przykład raportu w Google Analytics – wolumen kupionych produktów
Są jednak takie wymiary (dimensions), w których nie spodziewamy się braku wartości, a wręcz przeciwnie – oczekujemy dokładnych informacji, które będziemy mogli wykorzystać do analizy. Przykładowo, spójrzmy na źródło/medium sesji oraz przypisaną domyślną nazwę kanału.

Przykładowy raport źródło/medium w Google Analytics
Wartość „(not set)” została przypisane do kanału „Unassigned” („nieprzypisane”). Jak pokazuje ten przypadek, 10% użytkowników odwiedziło stronę ze źródeł, którym GA4 nie był w stanie przypisać żadnej wartości.
Warto zauważyć, że „(not set)” to nie to samo, co „(direct) / (none)” w wymiarach źródło/medium. W uproszczeniu, ta pierwsza oznacza brak wartości, a druga pustą wartość – i choć może się wydawać, że to to samo, w praktyce (i od strony technicznej) to dwie różne rzeczy. I dobrze – bo również z poziomu analizy inaczej interpretujemy obie wartości.
Jak zostało wspomniane wcześniej, „(not set)” nie dotyczy wyłącznie źródeł ruchu. Możemy zauważyć jego występowanie w wymiarach niestandardowych, ale np. również w wymiarze „Strona docelowa” (Landing Page). Jest spora szansa, że również w Twoim serwisie część stron startowych nie została rozpoznana. Co więcej, na liście możesz znaleźć również… pusty wiersz:

Przykładowy raport stron docelowych w Google Analytics
Pusty wiersz oznacza dane, których Google Analytics 4 nie zdążył przetworzyć – tutaj sprawa jest więc prosta: wystarczy zmienić zakres dat tak, by obejmował najświeższe zebrane dane. Zwykle wystarczy wykluczyć dzień “dzisiejszy” i “wczorajszy”, a wyniki dla tego okresu sprawdzić za kilka dni, gdy dane zostaną już przypisane przez narzędzie. Inaczej sytuacja wygląda dla użytkowników Google Analytics 360 – mają oni gwarancję przetwarzania danych do 4 godzin.
Przyczyny brakujących wartości możemy podzielić na kilka kategorii:
Brakujące wartości w wymiarach Google Ads można często naprawić, integrując GA4 z kontem Google Ads oraz włączając automatyczne tagowanie. W takim przypadku warto sprawdzić poprawność tej konfiguracji w obu narzędziach.
Jeśli spodziewasz się wartości innej niż „(not set)” w danym wymiarze (np. niestandardowym wymiarze „method” dla zdarzenia „login”), to możliwe, że coś poszło nie tak na poziomie wdrożenia. Przyczyną może być nieprawidłowe ustawienie tagów w Google Tag Managerze albo zmiana w kodzie strony, po której konfiguracja GA4 nie została zaktualizowana.
Jeśli więc problem dotyczy wymiaru niestandardowego (Custom Dimension) albo określonego zdarzenia, konfigurowanego np. w GTM – warto przyjrzeć się konfiguracji tagów.
Measurement Protocol (MP) to zaawansowany sposób przesyłania danych do GA4. Zwykle jest wykorzystywany do wzbogacania danych zbieranych na stronie lub w aplikacji o wartości, których brakuje przy standardowym śledzeniu. Jednak ze względu na sposób, w jaki działa Measurement Protocol – w oderwaniu od standardowego pomiaru – niepoprawnie wdrożony może sprawić, że (not set) pojawi się nawet w tak podstawowych wymiarach jak ścieżka strony. Dużo łatwiej jest również o nieprawidłowości wdrożenia, które wpływają na jakość danych. Jeśli korzystasz z MP, zdecydowanie warto upewnić się, czy to jego stosowanie nie wywołuje braków w danych.
Twój klient otwiera Twoją stronę. Następnie odchodzi od komputera lub telefonu, bądź przełącza się między innymi zakładkami i wraca po godzinie, by kliknąć w jeden z produktów. Dla niego to wciąż ta sama wizyta w serwisie, dla Analyticsa to już dwie sesje – druga rozpoczęła się wraz powrotem użytkownika i dokonaniem akcji. Tego typu scenariusze nie są rzadkie i to one mogą częściowo odpowiadać za braki w danych.
Inną przyczyną mogą być wtyczki do przeglądarek, które w celu anonimizacji użytkownika, mogą edytować przesyłane dane dotyczące przeglądarki, systemu czy urządzenia.
Niektóre z nich możemy ograniczyć np. dzięki wydłużeniu czasu trwania sesji. Według niektórych ekspertów, pomóc może także uszczelnienie tagowania UTM linków z zewnętrznych stron. W innych przypadkach… pozostaje pogodzić się z tym, że nie na wszystko jesteśmy w stanie cokolwiek poradzić.
Czas leczy rany. Oraz dane w Google Analytics 4.
Google Analytics 4 nie zawsze jest w stanie poprawnie przetworzyć dane z ostatnich 24 godzin. To oznacza, że dane z poniedziałku mogą być bardziej precyzyjne w środę niż we wtorek. Innymi słowy, jeśli widzisz „(not set)” w raportach – spróbuj wykluczyć poprzedni dzień, a końcową datę zakresu ustawić maksymalnie “na przedwczoraj”. Inaczej jednak sytuacja przedstawia się w przypadku Google Analytics 360. Jego SLA gwarantuje świeżość danych wynoszącą 4 godziny.
Wraz z rosnącym znaczeniem prywatności i wdrożeniem śledzenia po stronie serwera, obserwujemy wzrost udziału wartości „(not set)” w raportach GA4. Źródła wskazują, że niewłaściwe ustawienie Google Consent Mode lub filtrowanie danych po stronie serwera może uniemożliwić przypisanie źródła ruchu, co skutkuje linii „(not set)”. Warto więc przyjrzeć się konfiguracji trybu zgody i logice serwera, by ograniczyć „(not set)” nie tylko na poziomie UTMs, ale również infrastruktury.
Zaufanie do danych stanowi fundament każdej analizy. Dane zbierane w sposób nieprawidłowy zaburzają obraz. Dane niepełne są niewystarczające, żeby odpowiedzieć na postawione pytania i hipotezy biznesowe.
Wyobraźmy sobie sytuację, w której przygotowujemy zestawienie efektywności kanałów reklamowych. Na tej podstawie ma zapaść decyzja, które z nich przetrwają cięcia budżetowe, a które zostaną ucięte. Przegląd raportów e-commerce w Google Analytics 4 prowadzi nas do wniosku, że reklamy emitowane na uwielbianym przez prezesa medium społecznościowym nie przynoszą rezultatów. Jak go przekonasz, że 30% sesji, które są oznaczone jako „(not set)” i wygenerowały sprzedaż, to nie jest wynik tego źródła, w które tak głęboko wierzy? Co więcej – jaką masz pewność, że nie ma racji?
Im mniej wartości „not set” pojawi się w naszych danych, tym większa pewność, że nic nam nie umyka. A im szybciej uporamy się z przyczynami, tym lepiej – luk w danych nie da się sztucznie zapełnić!
Jak widać, „(not set)” jest powodem wielu „chorób” systemu analitycznego. Niektóre uleczysz dość łatwo, z innymi należy nauczyć się żyć. Całkowita eliminacja zjawiska nie jest możliwa. Naszym celem powinno być doprowadzenie do sytuacji, w której braki są na tyle małe, by cały zbiór danych był nie do podważenia. 10-15% wyników z „(not set)” zwykle jest akceptowalne, a wyniki powyżej 25-30% powinny być impulsem do podjęcia próby obniżenia ich udziału.
Nie ma jednej skutecznej rady na wyeliminowanie wartości „(not set)”. Dlatego poprawa jakości danych jest procesem ciągłym i długofalowym, a jego skuteczność zależy od naszej determinacji i wiedzy. Nagrodą za wysiłek są dane, które można bez zawahania przekuć w informacje, a te – we wnioski i konkretne decyzje biznesowe.
Historie sukcesów
Ostatnie wpisy na blogu