Zrozumienie danych z Google Search Console
DataOps i automatyzacja pobierania danych
Analiza nożyc AI Overviews i scoring ryzyka
Rekomendacje i działania naprawcze
Podsumowanie
Pierwszym krokiem w analizie danych dotyczących AI Overviews jest zrozumienie, jakie informacje są dostępne. Dane te pochodzą z Google Search Console. W Google Search Console kluczowe informacje znajdują się w zakładce „wyniki wyszukiwania”. Opierają się one na zapytaniach, w których pojawiamy się w wynikach wyszukiwania, liczbie kliknięć oraz liczbie wyświetleń. Na tej podstawie można przeprowadzić analizę.
Dane można wyeksportować z Google Search Console, a następnie, korzystając z Google Spreadsheets i narzędzi takich jak LLM (np. Gemini), przeprowadzić szczegółową analizę. Ograniczeniem jest dostępność jedynie 1000 wierszy do eksportu oraz fakt, że dane dostępne są tylko dla wybranego zakresu czasowego. Nie ma możliwości analizowania linii trendu dla dłuższych okresów. Aby ułatwić analizę, warto wyeksportować plik CSV i wgrać go do Google BigQuery. Analiza prowadzona dla klientów opiera się na autorskim modelu danych, który automatycznie importuje wszystkie dane do centralnej hurtowni w Google BigQuery. Więcej informacji o modelu danych znajduje się w opisie.
Pierwszym krokiem analizy jest zebranie wszystkich danych w jednym miejscu. Dostępny jest eksport z Google Search Console, który można następnie analizować w Google Spreadsheet lub zaimportować do BigQuery.
W Conversion od około półtora roku stosujemy w strategii podejście DataOps, zakładające maksymalną automatyzację danych i minimalizację czasu poświęcanego na ich zbieranie. Więcej o DataOps można przeczytać w dedykowanym wpisie na ten temat. W przypadku naszego rozwiązania i modelu danych konektor jest już skonfigurowany, ale można go również ustawić samodzielnie. Funkcjonalność ta nosi nazwę bulk data export, czyli masowy eksport danych. Jedną z największych zalet tego eksportu jest dostęp do pełnej listy wszystkich zapytań, na które pojawiamy się w wynikach wyszukiwania Google. Dane są dostępne w ciągu 48 godzin od konfiguracji, a eksport obejmuje dane dzienne. Funkcja ta jest darmowa, a jedynym kosztem pozostaje utrzymanie Google BigQuery.
Jeśli koszty utrzymania Google BigQuery są wysokie i stanowią barierę przed przekazywaniem kolejnych danych, warto zapoznać się z naszym poradnikiem dotyczącym optymalizacji kosztów w Google BigQuery. W przypadku naszego modelu danych możliwe jest nawet trzystukrotne zmniejszenie kosztów, co potwierdzają nasze realizacje. Po skonfigurowaniu eksportu z Google Search Console do Google BigQuery dane są wysyłane od momentu uruchomienia integracji, czyli od dnia konfiguracji. Aby uzyskać pełny zakres danych, należy pobrać dane historyczne za pomocą API. Warto zrobić to jak najszybciej, szczególnie w kontekście analizy AI Overviews, ponieważ API umożliwia dostęp do danych maksymalnie z ostatnich 16 miesięcy.
Proces pobierania danych warto zautomatyzować, na przykład przy użyciu Pythona, który codziennie pobierze dane przez API i połączy je z danymi już pobranymi przez eksport. Dzięki temu wszystkie dane, zarówno bieżące, jak i historyczne, będą dostępne do analizy trendów.
Ostatnim krokiem w gromadzeniu danych w hurtowni danych jest podłączenie Gemini, języka LLM, za pośrednictwem Vertex AI. Pozwala to na wykorzystanie możliwości Google BigQuery w kompleksowej analizie danych. Po zgromadzeniu wszystkich danych można przejść do pierwszej analizy i identyfikacji kluczowych elementów. Analiza nożyc AI Overviews polega na zestawieniu zagregowanych danych. W jednym wierszu przedstawiane są wyświetlenia, a w drugim – click-through rate (CTR). Analizujemy dane zarówno sprzed, jak i po wprowadzeniu AI Overviews. Różnica w CTR przed i po wdrożeniu określa wielkość tzw. nożyc AI Overviews.
Na przykładzie jednej z naszych analiz dane prezentowane są w formie tabelarycznej. Pokazujemy, jak zmieniły się wyświetlenia, kliknięcia i CTR po wprowadzeniu AI Overviews. Obliczone nożyce AI Overviews wskazują, że utraconych zostało niemal 800 tysięcy wizyt. Ta estymacja powstała na podstawie różnicy w CTR-ach przed i po wdrożeniu AI Overviews, pomnożonej przez aktualną liczbę wyświetleń w tej sekcji.
Nożyce w naszym frameworku są liczone tylko dla słów kluczowych o wysokim lub średnim poziomie ryzyka związanego z AI Overviews.
W analizie słów kluczowych może pojawić się także tzw. paradoks CTR. Polega on na tym, że zapytania znajdujące się na wysokich pozycjach mają niższy CTR. Wynika to z faktu, że pierwsze pozycje są przysłaniane przez sekcję AI Overview podsumowującą odpowiedź w wyszukiwarce. Identyfikacja tego paradoksu jest istotna, ponieważ wykorzystuje się go w scoringu do oceny zagrożenia ze strony AI Overviews. Drugim krokiem analizy było wstępne policzenie na dużych liczbach nożyc AI Overviews.
Trzeci krok polega na określeniu dla poszczególnych zapytań, wyeksportowanych z Google Search Console, dwóch wymiarów. Pierwszym z nich jest intencja, oznaczona jako No Simple, No Do, Website Visiting Person Query. Te wartości oznaczają, że jeśli pojawiamy się w wynikach wyszukiwania Google na dane zapytanie, No Simple dotyczy sytuacji, gdy użytkownik szuka bardzo konkretnej odpowiedzi, na przykład: „ile lat ma prezydent”. No to zapytanie wymagające bardziej rozbudowanej odpowiedzi, jak na przykład: „jak działa silnik hybrydowy”. Du odnosi się do sytuacji, gdy użytkownik chce wykonać jakąś akcję. Przykładowym zapytaniem może być kalkulator rat kredytu hipotecznego. Użytkownik, który chce dostać się na konkretną podstronę, wpisuje frazy takie jak „mBank Logowanie”, aby przejść bezpośrednio do strony logowania. Visiting Person Query to zapytania odnoszące się do lokalizacji w świecie rzeczywistym, na przykład „bankomat Ursynów”.
To pierwszy wymiar, któremu za pomocą Gemini lub innego LLM-a nadajemy kontekst zapytań pojawiających się w serwisie. Warto dodać, że intencja użytkownika pochodzi z raportu wykorzystywanego przez quality raterów – to 160-stronicowy podręcznik z wytycznymi. Dokument zawiera wytyczne dla osób oceniających jakość propozycji wyświetlanych przez algorytmy Google w odpowiedzi na zapytania. Jest to swoisty przewodnik, który pokazuje, jak Google rozumie intencje wpisywanych fraz. Intencje te mają charakter uniwersalny, ale można je dostosować do specyfiki własnego biznesu. Przykładowo, portal informacyjny będzie odpowiadał głównie na zapytania typu informational, serwis e-commerce na transactional, a lokalny biznes na zapytania związane z wizytą w fizycznej lokalizacji (in person query). To pierwszy wymiar analizy zapytań, które można zaimportować z Google Search Console i skategoryzować według odpowiadającej im intencji. Drugi wymiar to kategoria tematyczna, czyli określenie, czego dotyczy dane słowo kluczowe. Segmentacja według kategorii tematycznych pozwala zredukować setki tysięcy zapytań do maksymalnie kilkunastu kluczowych grup. Każdy serwis wymaga indywidualnego podejścia do tej segmentacji. Przykładowo, dla sklepu z elektroniką, RTV i AGD, kategorie zapytań mogą obejmować: specyfikację i parametry (np. iPhone 15 pojemność baterii), poradniki zakupowe (np. jaki telewizor do PS5), rankingi i porównania, opinie i recenzje, instrukcje obsługi, ceny, promocje i inne.
Narzędzia, takie jak Gemini, pomagają przypisać wszystkie zapytania do odpowiednich kategorii na podstawie wyników wyszukiwania. Po zakończeniu tego etapu kolejnym krokiem analizy jest ocena scoringu ryzyka związanego z AI Overviews.
Dla każdego słowa kluczowego wyeksportowanego z Google Search Console algorytm przypisuje odpowiedni scoring ryzyka. Scoring opiera się na czterech parametrach. Pierwszym z nich jest intencja, która ma wagę czterdziestu procent. Najwyższy scoring otrzymuje No Simple, co oznacza największe zagrożenie, oraz No i kolejne, w zależności od poziomu narażenia. Kolejnym parametrem jest aktualny CTR. Im niższy CTR w danym okresie, tym większe ryzyko obecności w IA Overview. W takich przypadkach pojawiają się tzw. zero klik wizyty, czyli sytuacje, w których użytkownicy otrzymują odpowiedź jeszcze przed kliknięciem w wynik wyszukiwania. Scoring uwzględnia paradoks pozycji i ma wartość dwudziestoprocentową. Następnie analizowane jest, jak bardzo trend załamał się przed pojawieniem się AI Overviews i po jego wprowadzeniu. Na tej podstawie każde słowo, które następnie agregowane jest do kategorii, otrzymuje scoring określający ryzyko spadku ruchu w związku z AOW. Wynik powyżej 7 oznacza wysokie ryzyko, między 4 a 6 i 9 – średnie ryzyko, natomiast poniżej 4 – niskie ryzyko.
Nożyce A Overfuse są liczone tylko dla słów kluczowych zakwalifikowanych jako medium i high. W ten sposób można pokazać, jaki wolumen ruchu jest tracony w związku z obecnością AOV. Po przejściu przez cztery poprzednie kroki – centralizacji danych, obliczeniu współczynników na zagregowanych danych, przypisaniu intencji i kategorii – cały proces zostaje zakończony. Do każdego zapytania dodaliśmy scoring ryzyka EA Overviews. Następnie przechodzimy do analizy tych danych. Na ekranie można zobaczyć, jaki procent wszystkich zapytań, na które się pojawiamy, rzeczywiście znajduje się w kategorii dużego, średniego lub małego ryzyka.
W przedstawionym przykładzie ponad 60% całego ruchu jest zagrożone przez AI Overviews w kategoriach Medium i High. Oznacza to 788 tysięcy kliknięć, czyli potencjalnych wizyt w serwisie, które tracimy właśnie z powodu AI Overviews.
Analizując dane, schodzimy do poziomu konkretnych kategorii słów kluczowych, aby sprawdzić, w których obszarach jesteśmy najbardziej narażeni. Możemy również przeprowadzić szczegółową analizę na poziomie poszczególnych zapytań, aby zobaczyć, jak sytuacja wygląda w naszym przypadku. Na podstawie tych danych można przygotować rekomendacje wynikające z przeprowadzonej analizy. Aby chronić skuteczne słowa kluczowe i sprawdzić możliwość odzyskania innych, szczególnie narażonych na ryzyko związane z AI Overview, warto rozważyć działania niezwiązane z wynikami wyszukiwania. Gdy targetujemy obszary, w których AI Overviews ukrywa nasze wyniki wyszukiwania, można przetestować alternatywne rozwiązania poza wynikami organicznymi. Przykładem jest stworzenie dedykowanego newslettera związanego z określonym aspektem biznesu, który dotychczas był pochłaniany przez AI Overviews.
Warto również rozważyć działania, które mogą zastąpić ruch z SEO generowany do tej pory przez Overviews. Kluczowe jest mierzenie każdej hipotezy, strategii oraz każdej zmiany w treściach i pozycjonowaniu SEO. Dzięki temu, że dane zostaną zebrane i odpowiednio policzone, można wyciągać wnioski i optymalizować działania.
Automatyzacja jest kolejnym krokiem w procesie DataOps. Zamiast jednorazowego pobierania i analizy danych, warto wdrożyć zautomatyzowane rozwiązania. Przykładem są alerty, które informują o istotnych zmianach w danych. Gdy dana kategoria słów kluczowych nagle traci na znaczeniu, na przykład w związku z AI Overview lub innymi czynnikami, analiza danych pozwala szybko zidentyfikować zmianę. Automatyzacja jest niezbędna do obserwowania trendów, zwłaszcza podczas testowania hipotez w ramach strategii contentowej lub SEO. Wszystkie wyniki można zwizualizować w Lookerze, aby osoby odpowiedzialne za content i SEO miały stały podgląd na zmiany.
W Conversion realizujemy te procesy w ramach modelu danych. Jest to jeden z naszych data produktów. Model danych naprawia dane, co ma szczególne znaczenie w przypadku GA4, gdzie często pojawiają się problemy z poprawną atrybucją i jakością informacji. Model danych agreguje wszystkie informacje w jednym miejscu, tworząc single source of truth. Optymalizuje dane, szczególnie z GA4 w kontekście Google BigQuery. W jednym z wcześniejszych wpisów pokazaliśmy, jak o 288 razy zmniejszyliśmy koszt obsługi raportów GA4 za pośrednictwem Lookera, wykorzystując eksport surowych danych z GA4.
Model monitoruje dane i w razie potrzeby wysyła alerty. Analizuje również dane za pomocą data produktów, takich jak analiza nożyc AI Overviews.
Proces analizy, o którym mowa, na początku wymaga zebrania wszystkich danych, jednak po wdrożeniu warto go zautomatyzować i na bieżąco śledzić wyniki. Pozwala to obserwować dane dotyczące wyników w organicznych wyszukiwaniach Google, wizualizować je na dashboardzie i ustawiać alerty na najważniejsze słowa kluczowe. Dzięki temu raportowanie efektów testów związanych z SEO lub strategią kontentową staje się prostsze.
Cały proces można zautomatyzować, konfigurując eksport z Google Search Console do Google BigQuery. Warto też skorzystać z naszego modelu danych, który już od pierwszego dnia wdrożenia umożliwia automatyczne i poprawne gromadzenie wszystkich potrzebnych informacji. W przypadku pytań dotyczących analizy lub modelu danych, zapraszamy do kontaktu.

Historie sukcesów
Ostatnie wpisy na blogu