Mýty o sitemap.xml

Tibor Peták, 18. November 2008

Už to raz tak bude… dobrý SEO špecialista sa od zlého odlišuje aj tým, že ignoruje techniky, ktoré nemajú zmysel a sústredí sa na to, čo web posunie smerom dopredu (aspoň míľovými krokmi). Za normálnych okolností som žiadnemu webu nedoporučil použiť sitemap.xml. Prečo? XML sitemapa nie je dostatočným riešením!

Sitemap.xml nepomáha lepšiemu hodnoteniu stránky

Google sa tak vyjadril:

A Sitemap does not affect the actual ranking of your pages. However, if it helps get more of your site crawled (by notifying us of URLs we didn’t previously didn’t know about, and/or by helping us prioritize the URLs on your site), that can lead to increased presence and visibility of your site in our index.

Sitemapa neovplyvňuje hodnotenie vašich stránok. Ale, ak napomáha tomu, aby sme indexovali väčšiu časť vášho webu (tým, že nás informujete o URL adresách, o ktorých sme pred tým nevedeli, a/alebo tým, že nám pomôžete priradiť prioritu URL adresám v rámci vášho webu), môže spôsobiť zvýšenie viditeľnosti vašich stránok v našom indexe.

Druhá časť odstavca myslí na efekt zvaný long tail, teda jeho výhoda by mala plynúť z toho, že viac stránok v indexe zameria viac kľúčových slov. Chyba tvrdenia je v tom, že neodkazovaná stránka nemá žiadnu silu a teda zameraného long tailu bude veľmi málo. Aj na long tail potrebujete odkazovú šťavu!

Sitemap.xml nerieši indexáciu

Google indexovanie stránky nachádzajúcej sa v sitemap.xml negarantuje:

Submitting a Sitemap helps you make sure Google knows about the URLs on your site. It can be especially helpful if your content is not easily discoverable by our crawler (such as pages accessible only through a form). It is not, however, a guarantee that those URLs will be crawled or indexed. We use information from Sitemaps to augment our usual crawl and discovery processes.

Odoslaním sitemapy sa uistíte, že Google bude o URL adresách na vašom webe vedieť. Môže to byť užitočné hlavne, ak je váš obsah neprístupný pre Googlebota (typicky obsah prístupný až po odoslaní formulára). Nie je tu však žiadna záruka, že tie URL adresy budú robotom navštívené a indexované. Informácie zo sitemapy používame ako rozšírenie pre náš obvyklý proces objavovania nových URL.

V praxi to vyzerá tak, že krátko po odoslaní sitemapy Google robot nové stránky naozaj navštívi, ale väčšinou ich zaindexuje až na základe klasických odkazov vedúcich na ne. Alebo ich zaindexuje ihneď a ak sa nepotvrdí žiadna odkazová šťava pre stránku, URL bez milosti z indexu vyhodí.

Sitemap.xml pre blog, to naozaj?

Čoraz viac sa v “zaručených” SEO tipoch pre blogy objavuje odporúčanie používať sitemap.xml. Ale na čo? Všetky blogy ponúkajú RSS a indexovanie na základe RSS pracuje do pár minút, sitemapa nie je rýchlejšia.

Za pár hodín pomocou RSS-ka dostanete do indexu viac ako 500 URL aj na blogu, ktorý nemá prakticky žiadny reálny PageRank (testoval som). Ale rovnako ako pri sitemape, akonáhle sa nepotvrdí opodstatnenie pre existenciu v indexe (odkazová šťava), všetky URL sa z indexu vyhodia.

Sitemap.xml môže aj škodiť

Ak vyhľadávače indexujú len istú časť webu, majú na to dôvod. Indexovanie slabších stránok pomocou sitemapy nijak nepridáva na celkovom profile webu. Len Google vie, či ich algoritmus využíva metriku, akou je pomer stránok webu v supplemental indexe ku stránkam v hlavnom indexe. Mne to znie logicky a kým ma niekto nepresvedčí o opaku, budem tvrdiť, že indexáciou stránok bez odkazovej šťavy webu škodíte.

Iný prípad škodlivosti je, ak sa zakáže indexovanie určitých stránok, ale zároveň zabudne pri generovaní sitemapy zakázané URL adresy vyňať. Google nevie, čo s tým a teda väčšinou stránku neindexuje, ale vo vyhľadávaní zanechá hnusný referer (taký ten odkaz bez titlu a bez popisu).

No a nakoniec, sitemap.xml si konkurencia stiahne rovnako ako Google. Využitie je už len na jej fantázii.

Dobre optimalizované stránky nepotrebujú sitemap.xml

Tak ako u meta description, indexovaní flashu, či odporúčaní používať dynamické URL adresy, sitemap.xml slúži len na skrývanie problému, nie jeho riešenie.

Ak chcete stránku indexovať, odkazujte na ňu. Ak chcete stránku indexovať často, meňte jej obsah. Ak chcete vyriešiť problém kanonických URL, použite presmerovania. Všetko sú to lepšie riešenia ako sitemapa.

Podobnosť s Google Add URL

Zaujímavé, že ak sa spomenie Google Add URL formulár, tak je všetkým jasné, že nemá zmysel. Podstata sitemapy je pritom rovnaká, umelo podstrkávate niečo, čo do indexu nepatrí.

Tak na čo vlastne slúži?

Nič nie je len čierne alebo biele, aj sitemap.xml má v niektorých prípadoch svoje využitie. Ak by vás zaujímalo, pýtajte sa na fóre. ;)


Podobné články / mohlo by vás zaujať:

14 komentárov k “Mýty o sitemap.xml”

1. Tom@S píše:
November 18th, 2008 at 3:49 pm

suhlasim az na jednu vec:”že indexáciou stránok bez odkazovej šťavy webu škodíte.” co potom take fora? Tie tiez nemaju na vsetky url odkazy a nemyslim ze ich indexaciou a zvacsovanim serpu si skodim, prave naopak.
Sitemapa je len skratka pomocka pre bota aby vliezol vsade, nikde vsak nie je zarucene ze url zoberie. Negativa vsak nevidim ziadne. Stale mi ako priklad sluzi forum, kde vidim ako odosiela dalsie a dalsie ulr cez sitemapu a google ich postupne berie ale zeby som videl nejake skody to nie, skor naopak pocet vstupov z googlu stupa

2. tybi-admin píše:
November 18th, 2008 at 4:03 pm

Tomas,

Za prvé… akoto, že fóra nemajú odkaz na každé URL? Také fóra som nevidel. A ak také existujú, tak akoto, že neriešia to, aby odkazovali na každé URL namiesto submitovania sitemapy?

Za druhé… bot nepotrebuje pomoc, indexuje veľmi dobre. V súčasnosti je viac problému s tým, koľko toho indexuje, než s tým, čo neindexuje.

Za tretie… píšeš, že návštevnosť z Googlu stúpa, ale stúpa na stránkach, na ktoré neodkazuješ (teda sú prítomné len v sitemape)? Lebo inak tvoje tvrdenie nehovorí nič.

3. Tom@S píše:
November 18th, 2008 at 5:18 pm

ano presne tak, nie je ani mozne aby som na vsetky temy vo fore robil nejake odkazy. Napriklad dost ludi chodi na slovo pokec a na ktory nie je ziadny odkaz okrem interneho linkovania takych tem je vela.
Pripadne ked hladaju domeny (seznam.sk) a tak ktora je ako tip v nejakej teme.

4. tybi-admin píše:
November 18th, 2008 at 5:27 pm

Ach môjtybože, interné linkovanie nie je odkaz??? Veď tebe ten článok musel dávať úplne iný zmysel, keď nerozumieš ani tomu, že odkazová šťava sa prenáša aj interným odkazovaním.

5. Tom@S píše:
November 18th, 2008 at 5:42 pm

ok tak mi vysvetli ako sa same medzi sebou linkuju temy v phpbb? Asi ziadno ze, tak preco su v indexe ked nemaju stavu? Tato logika pokryvkava

6. tybi-admin píše:
November 18th, 2008 at 6:12 pm

Nevysvetlím, ak niečo nevieš, pýtaj sa na fóre. Už mi je to trápne, ale rád by som ťa znovu poprosil, aby si nereagoval. Radšej žiadna diskusia, než diskusia s tebou o tvojej nevedomosti. Uff, ešteže ponúkaš SEO služby :))).

7. depi píše:
November 18th, 2008 at 6:34 pm

Chlapi ukludnite sa a rieste si to fakt niekdena fore, potom sa tu len mazu komentare a nedava to cele zmysel..

Ja osobne tiez sitemapam moc neverim, mam taky pocit, ze web kt. ma sitemapu sa indexuje pomalsie lebo ked Googlu predostriem hned vsetky linky zacne si davat nacas. Nemam to vsak overene tak je to len taky dohad (ako cele SEO :))

8. exot píše:
November 18th, 2008 at 6:45 pm

Mna by skor zaujimalo, ci nejak nevadi ked sa sitemapa aktualizuje a odosiela na server priliz casto, napr. mam vo wordpress plugin ktory pri kazdom pridani/zmene clanku vygeneruje sitemapu webu a odosle ju. Na dany web sa dost casto pridava obsah.

9. dusoft píše:
November 18th, 2008 at 8:59 pm

Tiez nevidim pridanu hodnotu v sitemap.xml. Argument o indexacii casti, ku ktorym sa robot nedostane, pada – robot sa dostane ku vsetkemu, ak ma web spravnu strukturu. Mozno mu to potrva o kusok dlhsie ale aspon budu mat vychodzie odkazujuce stranky uz existujuce hodnotenie, ktore sa prenasa dalej.

Ak poslem novy web v sitemap.xml, je pravdepodobne, ze robot indexaciu urobi, ale co sa realne dostane do vysledkov je uz otazne. Pri novych webov je celkom mozne, ze absolutne nic, kym si web nevybuduje trosku autority.

10. tybi-admin píše:
November 18th, 2008 at 10:26 pm

Depi, nie si sám, kto má zlé skúsenosti. Na fórach sa objavujú prípady, keď sa po odoslaní sitemapy síce zvýši počet zaindexovaných stránok, ale zníži sa návštevnosť (čo by potvrdzovalo domnienku pokazenia celkového profilu webu).

exot, to je pekné, že sa to pýtaš k článku, ktorý je proti takémuto submitovaniu sitemapy. :) Problém to určite nebude, ale zbytočnosť to naopak určite bude.

11. exot píše:
November 18th, 2008 at 10:35 pm

Ja som zatial so sitemapou nemal zle skusenosti, je pravda ze mi novy web kde ju mam (ako som spominal casto aktualizovanu) indexuje troska pomalsie, ale indexuje a to je hlavne.

Na blogu ju mam a nemam absolutne ziadny dovod ju odstranovat, dokonca sa odvazim tvrdit ze mi pomohla. Podla mna su to nepodlozene fakty a dohady a mozeme o nich diskutovat donekonecna pretoze nikto to nepodlozi. Tolko moj skromny neprofesionalny nazor :)

12. catman píše:
November 18th, 2009 at 2:48 pm

tom@s, radsej sem uz nikdy nic nepis a prosimta tu tvoju stranku tiez zrus.
hanba je to.. http://seo-servis.cz/source-zdrojovy-kod/2395395

13. Martin píše:
August 22nd, 2010 at 8:21 am

Podla mna tu uz moc spekulujete, sitemapu odporuca aj google samotny, preco by to malo nejakym sposobom skodit, ak sa robot dostane vsade? A catman to cele zabil seo-servis ano to je ikona :D

Súhlasíš - nesúhlasíš, reaguj!