21

Czy Google umie odczytywać daty publikacji treści – dramat w trzech aktach

… czyli jakie znaczenie na wyniki organiczne ma data publikacji wpisu i dlaczego warto ją ukryć przed Google?

Uwaga! Prezentowane w tym wpisie zmiany pozycji nie miały żadnego związku z aktualizacją algorytmu Google (Pingwin 3.0) – zupełnie przypadkiem problem wystąpił w tym samym czasie. Co zabawne, przez to Culture.pl pojawiło się nawet w opisywanych przy okazji zestawieniach zwycięzców którzy najwięcej skorzystali na zmianie.
01

Przykładowy raport z gazeta.pl nawiązujący do ruchów w wynikach organicznych ze względu na aktualizację Pingwin 3.0

1 Główny bohater dramatu

Wyobraź sobie, że masz stronę, która nie jest komercyjna, a jej istnienie nie zależy od sprzedaży czy też osiąganego zasięgu (ok, od tego w jakimś stopniu jest zależna, ale nie sprzedaje reklam w trybie odsłonowym).

Do tego prowadzą do niej dziesiątki tysięcy linków, z tysięcy domen (w tym wielu rządowych, Wikipedii oraz bardzo znanych portali zagranicznych, jak chociażby The Guardian czy New York Times), a sama domena ma PR 7 (a do niedawna nawet PR 8). Dodatkowo jest to strona, która nigdy nie prowadziła aktywnego pozycjonowania, a ma bardzo obszerne unikatowe teksty – niepowtarzalne w obrębie polskiego i zagranicznego internetu. Na uwagę zasługuje także fakt, że strona ta ma dość dużo ruchu, a jej jedynymi konkurentami są serwisy takie jak Wikipedia czy Filmweb – głównie ze względu na to, że w jakiejś części jest ona bazą biogramów polskich twórców i dzieł. Jest to świetne miejsce do wdrażania wszelkich rekomendacji Google, ponieważ właściwie niczym nie ryzykujemy i może być tylko lepiej.

 

2Tragiczne zdarzenie

Właśnie dlatego pewnego dnia postanowiliśmy skorzystać z markera danych strukturalnych Google – dostępnego w panelu Narzędzi Google dla Webmasterów. Jeśli nie korzystaliście z tego narzędzia, to musicie wiedzieć, że pozwala ono na oznaczenie danych strukturalnych dla konkretnego typu stron – oznaczając te elementy na kilku bądź kilkunastu stronach uczymy robota google rozpoznawania elementów zawierających takie dane, jak:

  • tytuł
  • autora
  • datę publikacji
  • obrazek
  • miejsce i datę (w przypadku wydarzeń)

Narzędzie to nie jest idealne i nie rozwiązuje kompletnie problemu technicznej implementacji mikroformatów w kodzie strony, ponieważ działa tylko dla kilku typów danych, ale pomimo to postanowiliśmy z niego skorzystać, aby sprawdzić czy przekazanie robotowi bardziej ustrukturyzowanych informacji odbije się pozytywnie na wynikach organicznych.

Kolejna informacja, która sprawia, że historia robi się ciekawsza to fakt, że marker pozwalający oznaczyć dany typ treści, wymaga podania ścieżki do treści danego typu.

W przypadku rzeczonego serwisu, czyli culture.pl oznaczaliśmy dwa typy treści:

  • wydarzenia (ścieżka culture.pl/pl/wydarzenie/*)
  • artykuły (ścieżka culture.pl/pl/artykul/*)

 

3I jego dramatyczne skutki

Po skutecznym nauczeniu bota odczytywania opisanych wyżej elementów włączyliśmy w GWT parsowanie tych danych i czekaliśmy na efekty.

Efekty, które wyglądały następująco:

02

Widoczność w searchmetrics

Tak natomiast w semstorm:

03

Niestety, ponieważ ten ogromny spadek przypadł na okres wakacyjny, a ruch skupiony wokół polskich artystów i dzieł jest dość mocno związany z rokiem szkolnym, nie dostrzegliśmy tego na poziomie danych w Google Analytics, ponieważ spadek był oczekiwany w tym czasie:

 04

Dopiero gdy nałożymy te dane na wyniki z zeszłego roku, dokładnie widać w którym momencie pojawił się problem:

05

Przerywana linia pokazuje jak powinien wyglądać ruch w okresie gdy występował problem.

Widzimy, że załamanie pod koniec sierpnia nie jest zwykłym trendem, ponieważ wyniki są ok 40% gorsze niż być powinny – rok do roku przez kilkanaście poprzednich tygodni właśnie taka była różnica w ruchu.

Na Wykresie z GA widać też, że ruch powrócił, gdy poprawiliśmy “problem” więc wróćmy do opisania co dokładnie stało się po włączeniu markera danych i jak sprawiliśmy, że ruch powrócił.

4Analiza techniczna

Gdy zauważyliśmy, że coś jest nie tak (niestety dopiero w październiku), gdy już wszyscy gimnazjaliści, licealiści i studenci zaczęli starannie studiować życiorysy twórców i ich dokonania artystyczne, przystąpiliśmy do analizy problemu.

Szybko zidentyfikowaliśmy frazy, które utraciły ruch, na podstawie struktury serwisu:

06

Potwierdzenie, że ucierpieli twórcy i dzieła

Sprawdziliśmy więc dla czołowych twórców historię pozycji korzystając z tego, że culture.pl mieliśmy podłączone do monitoringu dziennego w semstorm, co, jak się za chwile okaże, miało dość duże znaczenie w znalezieniu przyczyny.

Ponieważ problem rozpoczął się 17 sierpnia, wybraliśmy w semstormie zakres dat 17-20 sierpnia i sprawdziliśmy spadki:

Spadki feralnego dnia

Spadki feralnego dnia

Wyraźnie widać, że mamy tutaj spadki z pozycji typu 2-5 na 3-4 stronę wyników, dla fraz, które mają kilkadziesiąt tysięcy wyszukiwań miesięcznie – nie jest dobrze…

Niestety nadal nie znamy przyczyny, więc sprawdzamy, jak wygląda historia poszczególnych fraz, skupiając się na tych, które miały dużo ruchu i były wysoko – na potrzeby artykułu, wystarczy nam, że popatrzymy na poniższe cztery (pamiętaj, że najstarszy wynik jest na dole a najnowszy na górze). Przyjrzyj się uważnie tym wynikom – czy widzisz jakieś podobieństwa?

08

Fryderyk Chopin – historia pozycji

09

Julian Tuwim – historia pozycji

10

Aleksander Fredro – historia pozycji

11

Wisława Szymborska – historia pozycji

Czy w momencie gdy nastąpił spadek pozycji widzisz jakieś inne zmiany?

 Po pierwsze, dla jednego z powyższych wyników zmieniła się strona docelowa – Tuwim z sylwetki poety przełączył się na tekst o 10 twarzach Tuwima.

 Po drugie, dla każdego z powyższych wyników, w dniu spadku, w snippecie (na początku opisu wyniku) widocznym w wynikach Google, pojawiła się data – jak widać jest to data z dość odległej przeszłości – 2005, 2008.

Oznacza to, że Google potrafi ze strony wyekstrahować datę publikacji wpisu. Może to się wydawać logiczną konsekwencją działania opisanego na początku artykułu, ale niestety tak nie jest – dlaczego? Dlatego, że pokazaliśmy Googlebotowi jak pobierać te daty, ale wyłącznie w ścieżkach /pl/artykuł/* oraz /pl/wydarzenie/* – powyższe wyniki natomiast znajdują się w ścieżce /pl/tworca/*.

Wniosek nr 1: google nie respektuje ograniczenia związanego ze ścieżką, ustawionego w markerze danych.

Ok, ale czy treści na culture.pl rzeczywiście są tak stare? Ponieważ od dawna współpracujemy z redakcją tego serwisu wiemy, że prace nad sylwetkami trwają bez przerwy, co szybko potwierdziło się w podglądzie historii wersji analizowanych wyżej artykułów.

12

18 edycji strony o Fryderyku Chopinie – tylko w 2014 roku

Powyższy screen pokazuje historię modyfikacji sylwetki Chopina – 18 zmian w tym roku – od czasu powstania sylwetki w 2005 roku było ich co najmniej kilkadziesiąt. Uwierzcie mi na słowo, że dla zdecydowanej większości pozostałych stron docelowych historia aktualizacji wygląda bardzo podobnie.

Mimo to, google jak szalony zaczął przeindeksowywać stronę tuż po przesłaniu mu podpowiedzi odnośnie dat:

13

Wir indeksowania strony, tuż po oznaczeniu danych za pomocą markera.

 

Zaraz zaraz, przecież wszyscy zajmujący SEO wiedzą, że google bierze pod uwagę zmianę zawartości strony i przecież nie będzie ufał autorowi strony jeśli chodzi o datę zmiany treści bądź datę jej powstania. Przecież przy każdym zaindeksowaniu strony musi zapisać sobie jakąś sumę kontrolną obszaru z tekstem (no bo przecież wie, gdzie jest tekst, skoro wiele narzędzi SEO potrafi to zidentyfikować, to nie łudźmy się, że Google tego nie potrafi).

A jednak! pomimo tego, że culture.pl jest bardzo zaufaną stroną, pomimo tego, że treści na wysokich pozycjach zmieniają się kilkanaście razy w ciągu roku (są rozbudowywane i wzbogacane np. o multimedia) to Google ślepo wierzy w to, że data oznaczona (dla innego typu treści) markerem danych, to data ostatniej aktualizacji podstrony, co następnie przekłada się na dramatyczny spadek pozycji.

 

5Chwalebny powrót na oryginalne pozycje

Nasza analiza nie byłaby wiarygodna, gdybyśmy nie poparli tezy faktami. Wierząc w słuszność analizy, usunęliśmy (a właściwie odpublikowaliśmy) oznaczenie markera danych w narzędziach dla webmasterów.

Co ciekawe, na efekty nie trzeba było długo czekać (culture.pl należy do grupy serwisów, które mają specjalną prędkość indeksowania przypisaną przez Googlebota). Już po 3 dniach pojawiły się pierwsze powroty, a teraz, ok 2 miesiące później, praktycznie wszystkie frazy wróciły na swoje oryginalne pozycje. Widać to na poniższych screenach – gdzie wrócimy do Tuwima, Szymborskiej, Fredro i Chopina:

14

Fryderyk Chopin – pozycje z semstorm – spadek poza top50 i powrót

15

Widzimy tutaj również, że dwie z czterech fraz w ogóle wypadły poza top50 w okresie występowania “problemu technicznego”.

Uwaga!

Specjalnie dla czytelników bloga Critical otrzymaliśmy kod promocyjny od SEMSTORM – wpisz podczas zakładania konta kod „CRITICAL„, a otrzymasz stałą zniżkę 10% na dowolny z planów.

Szczerze polecamy to narzędzie ponieważ naszym zdaniem jest bezkonkurencyjne w zakresie monitorowania pozycji oraz analizy sytuacji w SERP – zarówno dla SEO jak i SEM.

Bez niego na pewno spędzilibyśmy wiele godzin próbując znaleźć przyczynę opisywanego w tym case study spadku.

Ten link prowadzi bezpośrednio do cennika z uwzględnionym rabatem (zanim wykupisz dostęp, musisz założyć bezpłatne konto tutaj)

P.S. Warto zaznaczyć, że SEMSTORM bezpłatnie migruje do swojego systemu historyczne dane ze Stat4Seo i innych popularnych systemów monitorowania pozycji!

6Wnioski i rekomendacje

Wnioski są dość bulwersujące – Google, który właściwie bez przerwy karmi nas informacjami z kategorii “Content is King”, w momencie, gdy widzi dane strukturalne, jak dziecko przyjmuje je na wiarę.

Możliwe, że to zachowanie jest spowodowane dużym zaufaniem do serwisu i w przypadku innych stron taka sytuacja nie zaistnieje, ale nadal bez odpowiedzi pozostaje pytanie: dlaczego jeśli treść jest najważniejsza, to tak drobna zmiana, jak przekazanie daty publikacji, sprawia nagle, że nasza super treść kompletnie traci wartość w oczach google?

Być może w zawrotnym cyklu kolejnych pand i pingwinów Google zapomniał o tym, co naprawdę jest ważne, a może po prostu nigdy nie udało mu się na wystarczającym poziomie analizować treści po polsku i tekst pisany przez znawców tematu na serwisie specjalistycznym, nie różni się dla niego od pierwszego lepszego spina zbudowanego na bazie tekstu z wikipedii?

Podsumowując, doskonałą rekomendacją z opisanej sytuacji jest potwierdzenie, że nie należy niestety ufać w dobre intencje Google i do każdego narzędzia które udostępnia podchodzić z dużą podejrzliwością.

Polecamy też Wam przeprowadzić na własną rękę testy związane z datą publikacji lub modyfikacji treści na pozycjonowanych przez Was stronach. My zmieniliśmy datę publikacji na datę ostatniej aktualizacji ale właściwie żadna z fraz nie jest obecnie na wyższych pozycjach niż przed spadkiem – nie wszystkie z nich były na 2 pozycji ustępując jedynie wikipedii :) Kto wie, może wnioskiem powinno być pokazywanie googlebotowi losowej daty z ostatniego tygodnia, aby uniknąć kary za starą treść, bo za to, że tekst jest świeży, ewidentnie nie ma żadnego bonusu.

Udostępnień 0
Łukasz Rysiak
 

Technologia, wydajność, internet - to moje życiowe pasje, zarówno w życiu zawodowym, jak i prywatnym. Codziennie doradzam klientom, jak rozwiązać ich problemy, i jakimi sposobami osiągnąć zamierzony cel.

Click Here to Leave a Comment Below 21 comments
Paweł Zinkiewicz - 12/11/2014

Super, akurat mam stronę przy której mogę to sprawdzić, spreparuję tylko daty aktualizacji ;-)
Jak potwierdzi się na nowej stronie, to może to być trochę smutne ;)

Reply
    Łukasz Rysiak - 13/11/2014

    Hej, dzięki za komentarz – gdy będziesz miał wyniki testów daj znać!

    Reply
Maciej - 13/11/2014

Trochę to zagmatwane, ale czy z waszego case’a wynika, że im starsza data tym lepiej czy gorzej? Rozumiem, że daty zamiast 2005 zmieniały się na 2013 z powodu np. aktualizacji artykułu?

Reply
    Łukasz Rysiak - 13/11/2014

    Cześć,

    wręcz przeciwnie – z naszej analizy wynika, że lepiej nie mówić google kiedy treść powstała, niż pokazać mu datę powstania, bo on, pomimo powszechnego mniemania o tym, że wie kiedy następuje zmiana treści – tak naprawdę tego nie wie, bo polega głównie na wstawionej przez nas dacie i jeśli powiemy mu, że data jest starsza niż u konkurencji, to nasze pozycje spadną – niezależnie od tego, że np. tak jak w przypadku artykułów opisywanych w artykule, aktualizujemy je bardzo często.

    Reply
Michał - 13/11/2014

Bardzo ciekawa analiza, w gruncie rzeczy podziwiam Was, że macie ochotę dzielić się takimi spostrzeżeniami publicznie ;) Podzielam optymizm Pawła w kierunku manipulacji datą!

Pozdrawiam autora! :)

Reply
    Łukasz Rysiak - 13/11/2014

    Dzięki za komentarz – myślę, że przedstawianie tego case study może jedynie pozytywnie wpłynąć na scenę SEO więc nie widzę powodu, żeby się nim nie dzielić :) Oczywiście fajnie by było gdyby Google się zreflektował bo ten przypadek pokazuje, że coś w algorytmie jest nie tak.

    Reply
Designer - 13/11/2014

Świeża data ma znaczenie, popatrzcie na wyniki na frazy w stylu „szukam …” np szukam copywritera, grafika, murarza, tynkarza, tłumacza itp (ale raczej nie pozycjonowane, szukam masażysty, lekarza, dentysty może już inaczej wyglądać). Świeże wpisy na forach nie związanych tematycznie idą dość wysoko. Sprawdzasz te same frazy po 2 tygodniach i już świeże zapytania na forach widoczne na miejsce starych.

Ogólnie świetny wpis, bardzo ciekawy temat. Dobrze wiedzieć, że google nie jest tak idealne jak się wszystkim wydaje i że mimo rozmiarów – algorytm to algorytm.

Duży plus za podzielenie artykułu na osobne sekcje, bardzo przyjemnie się to czyta. Prawie jak storytelling :D.

Reply
    Łukasz Rysiak - 13/11/2014

    tak, rzeczywiście informacje które są skategoryzowane jako szybko przedawniające się zyskują na tym, że google szybko dewaluuje stare – przypomina to trochę serwisy typu reddit czy wykop, gdzie liczy się to, co jest nowe. Ciężko jednak to rozciągnąć na profil Mickiewicza (już nie wspominając o tym, że kontent jest super aktualny, bo poza modyfikacjami sylwetki, jest ona powiązana z wszelkimi wydarzeniami wokól twórcy).

    Odnośnie formy – dokładnie o to chodziło – wyszedłem z założenia, że skoro tekst ma kilka ładnych stron, to wypadało by go opisać jako historię i podzielić na sekcje, a nie wypuścić suchy zbiór faktów – cieszę się, że się podoba :)

    a Google ma u mnie dużego minusa i teraz ze znacznie większym dystansem będę podchodził do implementacji jego rekomendacji.

    Reply
Grzesiek - 13/11/2014

Świetny artykuł. Jeszcze lepsze wnioski dotyczące wiary we wskazówki Google. Sam doświadczyłem rozczarowania gdy nieco dałem się zwieść Google i podobnie jak wy musiałem na własnym błędzie zrozumieć, że do tego co Google mówi trzeba podchodzić z dużym dystansem.

Reply
Marek - 13/11/2014

Nie pierwszy już raz okazuje się, że nadgorliwość w przypadku wyszukiwarki G. nie jest wskazana. Jak jest dobrze – nie poprawiaj :-)

Reply
    Łukasz Rysiak - 13/11/2014

    Zgadzam się, ale problem w tym, że nie da się wybrać, żeby jedne strony poprawić a inne nie. Szczerze mówiąc to oznaczając w markerze danych jedynie niektóre ścieżki liczyłem na takie ograniczenie ale jak widać pomyliłem się. Google zastosował odczytywanie dat w obrębie całego serwisu a nie wybranych ścieżek.

    Do tego wcale nie jest tak, że culture ma same dobre pozycje :) Jest mnóstwo fraz, na ktore nie ma go w topach pomimo że treść jest świetna.

    Reply
GrzegorzAdamiec - 13/11/2014

A czy ktoś sprawdzał jak rzecz ma się z blogami? Google bardzo dobrze sobie radzi z określeniem daty publikacji wpisów na blogach opartych na wordpress. Tam nawet nie trzeba nic mieszać w GWT :) Cięzko to określić jeśli blog podaje datę publikacji w sumie od samego początku, od instalacji tego skryptu. Te daty się potem pojawiają w wynikach wyszukiwania Google np w postaci 24 paź 2014 – opis artykułu lub 2 dni temu – tu opis artykułu. Może ktoś coś powiedzieć konkretnego na ten temat?

Reply
Dawid - 14/11/2014

A ja dodam trochę zwątpienia do tego artykułu.
O tuż mniej więcej w tym samym czasie co u Was miałem podobne zdarzenie (zarówno data spadku pozycji i pojawiania się daty publikacji strony w wynikach wyszukiwania (u mnie to 21.01.2013 = z odpaleniem strony jak i data powrotu na pozycje i zniknięcie daty publikacji strony z wyników wyszukiwania mniej więcej pokrywa się z Waszym przypadkiem. Minus 6 pozycji dostałem na kilka fraz = spadek na 2 stronę i znaczny spadek ruchu). Tłumaczyłem się aktualizacją algorytmu. Po przeczytaniu Waszego artykułu przypomniałem sobie, że też ta data w wynikach wyszukiwania się u mnie pojawiła. Różnica tylko jest taka, że ja nie wprowadziłem danych strukturalnych, nie mam nigdzie też daty publikacji a co ciekawsze to moja strona to wizytówka gdzie nic nie przypomina struktury blogu. Wg mnie to jakiś bug Google, który został załatany 1.10 bo w ten dzień strona wróciła na swoją pozycję a data zniknęła z wyników wyszukiwania. Tu screen z semstorm: http://prntscr.com/56a3zc. Jedynie to data w wynikach pojawiła się 1.09 czyli kilka dni po spadku a zniknęła 1.10 czyli w dzień kiedy strona wróciła na pozycje.

pozdrawiam
Dawid

Reply
    Łukasz Rysiak - 14/11/2014

    Cześć,

    pamiętaj, że w naszym przypadku akcja powodująca powrót była wykonana ręcznie i wydaje mi się, że dowody dobrze pokazują co i jak. Do tego sprawdzaliśmy również co się działo w topach w tym czasie i nie było tak, że nagle google zaczęło pokazywać daty publikacji dla innych wyników – ogólnie rzecz biorąc czołówka raczej się nie zmieniła. Związek wg mnie jest dość oczywisty – czy to jakiś poprawiony bug – chciałbym się dowiedzieć od Google ;)

    Reply
dawid - 14/11/2014

Sądzę, że warto zadać pytanie u źródła i zrobić test z danymi strukturalnymi. Osobiście nie sądzę, by doszło do spadków pozycji bo jak sam zauważyłeś „Dlatego, że pokazaliśmy Googlebotowi jak pobierać te daty, ale wyłącznie w ścieżkach /pl/artykuł/* oraz /pl/wydarzenie/* – powyższe wyniki natomiast znajdują się w ścieżce /pl/tworca/*.” googlebot pobrał datę z nie tyle co z niewłaściwej ścieżki ale podstawil datę 1 publikacji jak to zrobił u mnie. Nie mniej jednak zrobię trik z datą na kilku artykułach i zobaczę czy zmieni się raz sama data a dwa pozycje w serpach.

Reply
Wyrazista - 15/11/2014

Nie ma żadnych bonusów dla wpisów z nową datą, więc pewnie też nie ma wielkiego sensu poświęcać czasu na manipulowanie datami starszych wpisów.

Reply
Tomasz Biegun - 26/11/2014

Bardzo ciekawy artykuł. Przede wszystkim wielki szacunek dla Was za to, że się podzieliście tym case study. Ciekawy i chyba nieznany szerszemu gronu przykład.

Reply
Adam - 06/03/2015

To jak wyjaśnić fakt, że im starszy artykuł, tym wyższa jego pozycja w serpach, pomoimo braku aktualizacji?

Reply
    Łukasz Rysiak - 19/03/2015

    Adam, masz na myśli jakiś konkretny przypadek?

    Reply
Tomek - 22/07/2015

Korzystam z najpopularniejszego cmsa blogowego, czyli WordPressa dla bloga sklepu. Czy zatem wystarczy usunąć w kodzie szablonu informacje o datach?

A co z sitemapą? Przecież tam też występują informacje o dacie tj konkretnie o dacie ostatniej modyfikacji posta.

Z góry dziękuje za odpowiedź.

Reply

Leave a Reply:

0 Udostępnień