4

Sprawdź indeksację sitemapy z pomocą arkuszy Google

sprawdzanie indeksacjiDzisiejszy wpis będzie krótki, ale mam nadzieję, że pomocny w sytuacji, gdy musisz szybko zweryfikować problemy z indeksacją serwisu.

Być może masz za sobą lekturę mojego wpisu o narzędziach Google dla webmasterów. Opisuję w nim m.in., w jaki sposób sprawdzić zaindeksowanie sitemapy.

Problem polega tylko na tym, że narzędzia Google pokazują, owszem, procentowe zaindeksowanie mapy strony, ale nie informują, które konkretnie strony obecne w sitemapie nie trafiły do indeksu Google.

Tę informację musisz uzyskać na własną rękę, a ja dzisiaj dam Ci do tego narzędzie.

1 Arkusz do sprawdzania indeksacji

Sposobów na sprawdzenie indeksacji sitemapy jest wiele i każdy szanujący się SEO-wiec ma na to swoją metodę.

W przypadku dużych serwisów, mających w mapie tysiące podstron, raczej nie obejdzie się bez wyspecjalizowanego narzędzia, które potrafi rotować proxy, żeby uniknąć blokady ze strony Google.

Jednak w w przypadku mniejszych projektów, np. audytu serwisu firmowego, bloga czy małego sklepu, znakomicie sprawdzi się arkusz Google, który dla Was przygotowałem.

Sprawdzanie indeksacji w Google

Zacznij od tego, żeby utworzyć swoją kopię tego arkusza (menu Plik -> Utwórz kopię).

Potem przejdź do karty Indeksacja i w komórce B1 podaj adres sitemapy XML, która zawiera linki do sprawdzenia.

W zależności od wielkości sitemapy, po kilkunasu – kilkudziesięciu sekundach obok każdego linku powinieneś zobaczyć informację o stanie indeksacji (brak strony w indeksie lub data ostatniej kopii) oraz odnośnik, pozwalający ręcznie zweryfikować zawartość cache’u Google.

2 Jak interpretować wyniki?

Najważniejszą kwestią jest oczywiście przeanalizowanie, które linki obecne w sitemapie nie są zaindeksowane przez Google.

Przejdź przez takie linki i przeanalizuj każdą podstronę.

W wielu przypadkach brak indeksacji jest łatwy do wychwycenia – np. strona jest jednocześnie zgłoszona do sitemapy i ma ustawiony meta-znacznik „noindex”. W innych wypadkach może zwracać błąd serwera 500 lub wręcz błąd brakuj strony (404).

Po takim audycie podejmij odpowiednie działania, które będą zmierzały w jednym z dwóch kierunków:

[unordered_list style=”tick”]
  • usunięcie z sitemapy stron, które nie powinny się w niej znaleźć
  • usunięciu błędów, które uniemożliwiały indeksację
[/unordered_list]

Gdy uporasz się z tym zadaniem, w kolejnym kroku zwróć uwagę na datę kopii zaindeksowanych przez Google stron. Powinno Ci zależeć, aby indeks dla większości podstron był możliwie świeży, najlepiej z kilku ostatnich dni.

Jeśli jednak tak nie jest i kopie podstron pochodzą sprzed paru tygodni (lub, co gorsza, paru miesięcy), to znak, że trzeba podjąć działania zaradcze. Także w tym wypadku przyczyn może być kilka:

[unordered_list style=”tick”]
  • strony są bardzo głęboko schowane w strukturze nawigacyjnej serwisu
  • strony (być może błędnie) mają ustawione bardzo długie odstępy odświeżania w samej sitemapie xml
  • serwisowi brakuje linków przychodzących, przez co Google przypisuje mu niski priorytet  crawlowania
  • serwis ma zbyt wiele zduplikowanych podstron, które Google celowo ignoruje
[/unordered_list]

Konkretne rozwiązania będą oczywiście zależeć od tego, co uznasz za najbardziej prawdopodobną przyczynę powolnego odświeżania indeksu przez Google.

Główny problem, jaki możesz napotkać w pracy z tym arkuszem, to wspomniane już blokowanie przez Google po kilkukrotnym użyciu. Niestety, Google nie lubi żadnych automatów odpytujących indeks wyszukiwarki.

Jeśli zatem zauważysz, że arkusz przestał działać i pokazuje, że strony nie są zaindeksowane, choć wiesz, że są, po prostu odczekaj godzinę lub dwie i spróbuj uruchomić go ponownie.

Marcin Lejman
 

Jestem współwłaścicielem Critical.pl. Prowadzę przede wszystkim projekty związane z analityką internetową, optymalizacją konwersji i budową strategii online, a nadzoruję działania SEO i PPC prowadzone przez naszą firmę. Jeśli czujesz, że Twój biznes ma niewykorzystany potencjał i chcesz go rozwinąć, skontaktuj się ze mną - chętnie porozmawiam o możliwościach.

Click Here to Leave a Comment Below 4 comments
kinkywinky - 03/01/2015

przygotowalem plik sitemap – generatorem dzialajacym wg wytycznych googla oraz sitemap.org – lecz formularz zwraca błąd o treści „to raczej nie jest prawidłowa sitemapa”. jaki format powinna ona zatem posiadac?

Reply
Piotrek - 16/01/2015

dzięki! pomocny temat.

Reply

Leave a Reply: