Jak se bránit vykradení?

Když si přečtete různá internetová fóra, rychle pochopíte, že s vykrádáním obsahu z jiných webů si dnešní mladí provozovatelé webů hlavu nelámou. Zkopírování cizího obsahu nebo jeho části, umístění na vlastní web a instalace Google AdSense je totiž velice snadné (stačí použít třeba RSS aggregátor). Dotyční tak zadarmo získají obsah na svém webu, a pokud se budou snažit, je tu i šance, že se ve vyhledávačích umístí lépe, než zdrojové weby. Jak se takovému vykrádání můžete bránit?

Popravdě řečeno, možností, jak se vykrádání webu bránit, mnoho není. Alespoň tedy o žádné účinné prevenci nevím. Samozřejmě můžeme vypnout RSS výstup na svém webu, pomocí JavaScriptu zablokovat pravé tlačítko myši a tak znemožnit kopírování textu přes schránku. Web je možné vytvořit v Silverlightu nebo Flashi, ze kterého se texty o poznání hůře komplikují.

Všechna tato řešení však mají více nevýhod, než přínosů. Vypnutím RSS výstupu se připravíte o potenciální zdroj návštěvnosti. Zákaz kopírování textu do schránky JavaScriptem není účinný vždy, navíc si kdokoli může zobrazit zdrojový kód stránek a obsah převzít odsud. Použití Flashe zase znemožňuje plné využití technik pro optimalizaci stránek pro vyhledávače.

Je zde možnost použít specializované nástroje, které zašifrují HTML stránky, ale toto řešení většinou stojí dost peněz, navíc jej nelze aplikovat na HTML výstup z různých redakčních systémů.

Vyzkoušejte Copyscape

Přestože neexistuje stoprocentně účinná prevence, můžete se alespoň pokusit vyhledat zloděje svých textů. Existuje speciální a v zahraničí hojně používaný nástroj Copyscape. Slouží k vyhledávání duplicitních textů. Do Copyscape zadáte adresu stránky nebo zkopírujete část textu a spustíte vyhledávání.

Pokud nějaké jiné webové stránky, které jsou indexovány ve vyhledávačích, obsahují zadaný text nebo text ze zadané webové adresy, zobrazí vám Copyscape seznam takovýchto webů. Dokonce dovede najít i nápadně shodné části vět.

copyscape.png

Když na některou z nalezených stránek klepnete, zobrazí se její obsah v rámu Copyscape a tento nástroj vám také zvýrazní ty části, které jsou duplicitní s vaším webem.

Pokud si zvyšujete návštěvnost tím, že RSS výstup ze svého webu máte registrován v některém z veřejných RSS agregátorů, počítejte s tím, že Copyscape je bude zahrnovat do seznamu nalezených duplicit. Taktéž bude nabízet duplicity v podobě stránek, které zveřejnily například stejnou tiskovou zprávu.

Nalezli jsme vykradače, co dál?

Pokud narazíte na web, který vykradl vaše texty, pak nastává otázka, jak postupovat dále. Obecný postup (doporučovaný i Copyscape) je kontaktovat provozovatele webu a zkusit se s ním domluvit. Pokud to nepomůže, kontaktujte firmu, u které jsou stránky hostovány. Kontaktní informace můžete vyhledat i pomocí nástroje Whois zde na Maxiorlovi.

Placené služby Copyscape

Kromě jednoduchého vyhledávání duplicitního obsahu vám Copyscape nabídne i propracovanější, placené služby. Služba Premium nabízí zmíněné vkládání textu přes schránku, zatímco zdarma dostupná varianta funguje pouze s online obsahem. Vyhledávání pomocí služby Premium vás přijde na 0,05 USD (méně než jednu korunu) za jedno hledání.

Placené Copyscape Premium není omezeno počtem nalezených výsledků a dovede najít více případných duplicit. Zajímavostí je nabídka API, pomocí kterého můžete Copyscape implementovat přímo do nějakého skriptu. Díky podpoře vyhledávání offline obsahu Premium využijete v případě, že chcete dopředu najít případné duplicity článku, které vám dodal nějaký externí autor. Odhalení podvodníků, kteří vám slibují originální obsah, je tak otázkou několika sekund.

Druhá placená služba se jmenuje Copysentry. Jde o nástroj, který slouží k okamžitému odhalení jakékoli stránky, která vykradla váš web. Služba nepřetržitě monitoruje váš web a v případě, že najde duplicitní obsah, ihned vás upozorní e-mailem. Na výběr jsou dva intervaly kontrol – týdenní (za 4,95 USD měsíčně) a denní (za 19,95 USD měsíčně). Cena zahrnuje kontrolu deseti stránek, další jsou za mírný příplatek.

I když si placené hledání na Copyscape neobjednáte, doporučuji čas od času tuto službu využít. Není na škodu se dozvědět, zda někdo neparazituje na vaší práci.

 

Buďme ve spojení, přihlaste se k newsletteru

Odesláním formuláře souhlasíte s podmínkami zpracováním osobních údajů. 
Více informací v Ochrana osobních údajů.

Autor článku: Jan Polzer

Tvůrce webů z Brna se specializací na Drupal, WordPress a Symfony. Acquia Certified Developer & Site Builder. Autor několika knih o Drupalu.
Web Development Director v Lesensky.cz. Ve volných chvílích podnikám výlety na souši i po vodě. Více se dozvíte na polzer.cz a mém LinkedIn profilu.

Komentáře k článku

návštěvník

Podle mě je obrana proti duplicitnímu obsahu jednoduchá, obvykle stačí dané osobě jen pohrozit trestním oznámením, a pokud to nepomůže, tak jej opravdu podat. Vzhled k tomu, z jaké sorty lidí se duplikátoři skládají je první řešení skoro 100% účinné... Potíž je, když mají weby na freehostingu, ale tam se zase tolik duplicit nebojím, Google i Seznam pozná, že ten web je okopírovaný shit a dá tomu ban :)

Profile picture for user Jan Polzer

To je ale zřejmě účinné jen v českých podmínkách... Mimochodem, už jste někdo podobnou situaci musel řešit? S jakým výsledkem?

návštěvník

Naopak většina freehostů po reportu dané weby maže.

Ale otázkou je jestli to má cenu, jelikož se často stane, že na okopírovaném webu jsou všechny odkazy funkční a odkazují na vás apod, takže někdy tj skoro i výhoda.)

Profile picture for user Jan Polzer

Určitě to cenu má, duplicitní obsah nemají rády vyhledávače a panelizují za něj.

návštěvník

I s tímto mám zkušenost, bohužel jednu dobu "frčeli" mé fotky na internetu. Nevyplatilo se mi být naivní a vstupovat do světa internetu s otevřenou náručí a vystrčeným zadkem (to aby si každý mohl spočítat kolik tam mam pih). Fake profily jsem objevovala náhodou i za pomocí známých. Většinou se moje fotografie používali jako nástroj pro "virtuální" zvyšování sebevědomí a balení co nejvíce chtivých a důveřivých chlapců a chlapů. Kuriózní byly taky případy, kde mě dokonce označovali za ruskou supermodelku, to jsem se nasmála, ale trochu mě to polichotilo :D (s rezervou). Nejhoří byl případ, kdy jsem zabránila podvodu a to tím, že jsem jednomu uživateli ( měl fake profil v přátelích) napsala o nepravosti jeho kamarádky. Začal mi vyprávět, že byl u mě doma, ale já jsem tam nebyla, nýbrž moje starší sestra (pozn.: žádnou starší nemám, mám mladší - i když bůhví třeba mám nějakou nevlastní :D) a že po něm chtěla 20 tis. Že jsem (ten fake profil) vážně nemocná atd. Ten týpek mi nevěřil, tak jsem se sešli. Je to docela síla a o podobných podvodech s využím fotky někoho jiného můžeme slyšet v médiích.

návštěvník

Já osobně zatím tohle nijak neřešil. Podle mě je celkem účinné (sám to tak na blogu používám), mít článek rozdělený na perex a vlastní obsah, přičemž v RSS exportu je pouze perex článku s úvodním slovem o tom, čemu se článek věnuje. Pokud pak někdo agreguje můj RSS zdroj, tak mi to paradoxně může pomoci v návštěvnosti, protože uživatel si přečte perex a zaujme-li jej, tak klikne na odkaz, který samozřejmě vede na celý článek na mém blogu ;).

Samozřejmě něco jiného by bylo, pokud by někdo cíleně kopíroval obsah mých článků a následně je zveřejňoval po svým jménem někde na svém blogu. To se ale celkem těžko zjišťuje. Pokud jde o citace, tak těm se nijak nebráním, je-li uveden odkaz na zdroj. Sám se také vždy snažím pokud píši o nějaké informaci, jíž jsem dohledal např. na nějakém konkrétním blogu, uvést odkaz na původní článek a link na daný blog.

návštěvník

 Já to řešil kdysi dávno výše uvedeným způsobem na mých bývalých stránkách o Mirandě :) a vyřešil...

návštěvník

Nedávno jsem psal taky text o plagiátech, sice to není přímo k vykrádání RSS, ale obsahu webu se to hodí určitě.
Jinak s kopírováním obsahu mám vlastní zkušenost, třeba můj text o WebSpellu je hojně kopírován.
Psal jsem "autorovi" nic se nestalo, psal jsem na hosting (FREE - IC) opět se nic nestalo. Bohužel, tak jsem si na web hodil alespoň reklamu, jelikož zlodějíček měl až takovou drzost, že si linkoval obrázky přímo ode mě.
Vím jde to nějak ošetřit přes .htaccess, ale jak jsem zatím nezkoumal, ale asi se na to budu muset mrknout a do všech obrázků si hodit copyright.

Profile picture for user Jan Polzer

toto dejte do souboru .htaccess:
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://maxiorel.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://maxiorel.com$ [NC]
RewriteRule .*\.(jpg|jpeg|gif|png|bmp)$ - [F,NC]

Prostředí dva řádky uvádějí weby, ze kterých je hotlinkování povoleno. Poslední řádek pak uvádí seznam přípon obrázků nebo jiných souborů, kterým zakazujete hotlinkování.

Přidat komentář

Odesláním komentáře souhlasíte s podmínkami Ochrany osobních údajů

reklama
Moje kniha o CMS Drupal

 

Kniha 333 tipů a triků pro Drupal 9


Více na KnihyPolzer.cz

Sledujte Maxiorla na Facebooku

Maxiorel na Facebooku

Poslední komentáře
Hosting pro Drupal a WordPress

Hledáte český webhosting vhodný nejenom pro redakční systém Drupal? Tak vyzkoušejte Webhosting C4 za 1200 Kč na rok s doménou v ceně, 20 GB prostoru a automatické navyšováním o 2 GB každý rok. Podrobnosti zde.

@maxiorel na Twitteru

Maxiorel na Twitteru