Duplicitný obsah

Tibor Peták, 29. Máj 2008

Duplicitný obsah má dve roviny. Jednak sa môžeme baviť o duplicitnom obsahu na úrovni celých stránok alebo na úrovni blokov (kusov textu) a inak o duplikátoch v rámci jedného webu alebo o duplikátoch medzi webmi.

Je asi jasné, že duplicita na úrovni stránok je omnoho škodlivejšia ako bloková. Bloková duplicita je dokonca v určitej miere prirodzená, stáva sa veľmi často a legitímne, že stránka cituje inú.

Malo by byť rovnako jasné, že duplicita v rámci webu je väčšinou menší problém ako duplicita medzi rôznymi webmi. Dôvod je zrejmý… duplicita v rámci webu sa stáva aj “náhodou” a aspoň je ako originál označený text autora, kdežto duplikáty medzi stránkami sa náhodou nestávajú a môžu ukradnúť webu autorstvo.

Čo je a čo nie je duplicitným obsahom?

Duplicitným obsahom je aj to, ak skopírujete len jednu dlhšiu vetu, i keď vás to nijak nepoškodí. Duplicitným obsahom však nie je, ak preložíte 8 áštvoriek anglického textu do slovenčiny. Zdá sa vám to divné?

Vyhľadávač nie je matka Tereza a nemôže, alebo skôr nechce/nepotrebuje postihovať plagiátorov-prekladateľov. Pre vyhľadávač je prvoradé, aby dodal hľadajúcemu to, čo hľadá. A z tohto pohľadu je preklad veľmi užitočný pre používateľov, ktorí neovládajú cudzí jazyk.

Púhe prepísanie textu nestačí!

Ak si myslíte, že môžete úspešne kopírovať texty (veď stačí prepísať pár slov v texte), mýlite sa. Vyhľadávače rozpoznávajú aj tzv. near duplicates (podobné stránky = skoro-duplicitné). Ak by ste chceli text prepísať na nerozoznanie od originálu, môžete napísať rovno vlastný.

Priama penalizácia webu kvôli duplicite neexistuje!

Ono totiž existovať nemusí. Stačí, ak vyhľadávač zobrazí vo výsledkoch hľadania len originál. Google na to má svoj vlastný nástroj – supplemental index (i keď už vlastne ako zvláštny index nefunguje, stále sú podradné stránky istým spôsobom označované). Ak Google nájde obsah, ktorý už vo svojom indexe má a má ho na dôveryhodnejšej stránke, pošle “nový objav” do supplementalu. Nový objav potom nevyskakuje vo výsledkoch hľadania.

Takže Google vôbec nepostihuje tých, čo kopírujú obsah? Ale áno, trest za kopírovanie obsahu je ten, že sa neobjavia vo výsledkoch hlavného hľadania, ergo ich snaha vyšla nazmar. Je to jeden z dôvodov, prečo nie som za hosťovské príspevky na blogoch, ktoré už boli uverejnené niekde inde. Jeden z nich (v horšom prípade autor, v lepšom prepisovateľ) ťahá za kratší (supplementalový) koniec. Sú tu predsa iné možnosti ako upozorniť na dobrý článok! (viď Pikiho celulózový spôsob s pridaným vlastným komentárom).

Ako určí vyhľadávač originál?

Myslíte si, že ten, čo uverejnil článok prvý je originál? Vo veľa prípadoch to tak bude, ale kvôli rôznym frekvenciám indexovania webov Google nemusí uložiť do svojho indexu originál ako prvý. Okrem toho sú prípady, kedy sa originál uverejní neskôr ako jeho kópia. Preto Google nemá inú možnosť (vyznieva to, akoby tento spôsob nebol dostačujúci, ale nie je to tak myslené ;)) len použiť faktory ako Trust Rank v posúdení toho, kto bude v hlavnom indexe a kto vo vedľajšom.

Ak má niekoľko kópií v indexe vysoký Trust Rank (napr. preberanie článkov TASR rôznymi spravodajskými portálmi – Sme, Pravda, Hospodárske noviny, apod.), Google zobrazí v hlavnom indexe všetky a nechá na používateľovi, od koho si informáciu prečíta. “Originálov je v tomto prípade niekoľko.”

Na záver jeden nástroj na kontrolu duplicít medzi webmi

Pomocou Copyscape zistíte napríklad, že niekto, kto ponúka SEO služby, skopíruje vašu definíciu SEO a pridá: A to poskytujeme. :)))

Skopírovaná definícia SEO

Alebo, že niekto skopíruje vás článok o SEO, pridá ho do tutoriálov a podpíše vlastným webom.

Copyscape

Skopírovaný text podpísaný ako webyseo.sk

PS: Malá rada, ako obísť duplicitu

Piki v komentároch k tomuto článku poradil, ako sa dá problém duplicity pri (dúfam, legálnom) preberaní článkov obísť. Je to veľmi jednoduché, ale účinné len u navštevovanejších stránok: Nechajte ľudí článok komentovať, vytvoria vám v okolí článku dostatok ďalších informácií, aby Google považoval stránku za hodnú hlavného indexu.


Podobné články / mohlo by vás zaujať:

9 komentárov k “Duplicitný obsah”

1. tybi-admin píše:
Máj 29th, 2008 at 11:36 am

“Chcelo by to nejakú fintu fň.”

Finta fň za istých okolností existuje. Hint je priamo v článku, konkrétne táto veta: Duplicita na úrovni stránok je omnoho škodlivejšia ako bloková.

Otázka, ktorá sa priam tisne do úst… Ako urobiť z duplicity na úrovni stránok duplicitu blokovú?

Správna odpoveď získava odkaz na svoj blog. ;)

2. Piki píše:
Máj 29th, 2008 at 11:45 am

Odhadujem, že to je zmeniť podiel duplicitného textu na celkovom texte daného URL pri porovnaní s originálnym url. Prosto tam čosi dopísať. Ručne či automatom.

3. tybi-admin píše:
Máj 29th, 2008 at 12:32 pm

Presne tak… signifikantne zvýšiť podiel originálneho textu.

Lenže ručne je to veľa roboty, z toho tá otázka na fintu fň vznikla. A automatické riešenie je len málo spoľahlivé, respektíve aspoň polospoľahlivé riešenie vyžaduje viac práce ako ručné dopisovanie.

Ako sa dá zvýšiť podiel originálneho textu bez námahy? ;)

4. Piki píše:
Máj 29th, 2008 at 1:33 pm

Nechám pracovať ľud :-) Komentáre a podobne, napríklad.

5. Roman píše:
Máj 29th, 2008 at 1:43 pm

nechas tvorit obsah ludmi… (komentujte, hodnotte, piste recenzie, bla bla bla..)

6. Roman píše:
Máj 29th, 2008 at 1:43 pm

S krizom po funuse ;-))

7. tybi-admin píše:
Máj 29th, 2008 at 1:56 pm

:)))

8. Andy píše:
Máj 29th, 2008 at 2:13 pm

Hehehe, záver je pekný : )

9. Recepty píše:
November 23rd, 2011 at 9:24 am

pekne finty, hlavne ze pripojit blog ;-)

Súhlasíš - nesúhlasíš, reaguj!