Email: longhand@longhand.hu
  • Blog
  • Bemutatkozás
  • SEO
  • Ajánlatkérés
  • Blog
  • Bemutatkozás
  • SEO
  • Ajánlatkérés

30
jan
21

Duplikált tartalom

Szerző: LonghandSEO cikkek21 hozzászólás

duplikalt-tartalom.gifEgyik leggyakrabban előforduló probléma és az a fajta jelenség ami legtöbb weboldal esetén nem is kerül felismerésre. Nem kevés forgalomtól eshet el a weboldal duplikált tartalommal (na és még környezetszennyező is).

Keresők részéről világosak az okai a duplikált tartalom ellen eszközölt kemény algoritmikus “intézkedéseknek”: elsősorban komoly veszély a találati listák minőségére, több találatra azonos vagy nagyban hasonló tartalmak listázása, másrészt pedig nem kevés terhelést jelenthetnek a kereső robotok számára a scriptekkel generált, reprodukált tartalmak.

(A SEO eszközök szekcióban találhatóak duplikált tartalmakat kereső eszközök)

Cikkemben leírom a tipikus duplikált tartalmat okozó hibákat, amelyekre érdemes figyelni, ha nem szeretnénk hátrasorolásokat a kulcsszavas helyezéseinkben vagy rosszabb esetben indexen kívülre kerülni, súlyosabb hibák által.

Duplikált tartalom – büntetés és a backlinkek

A keresők nagyon rosszul kezelik a duplikált tartalmakat néhány esetben, pl. amikor nem a tartalmat lopó oldal szenvedi a duplikált tartalom kárát, hanem az “eredeti” kerül 30 hellyel hátrébb a fő kulcsszavaira a keresőben.
Duplikált tartalom esetén a jó minőségű backlinkek legjobb eszközök a büntetés ellensúlyozására, kiegészítő találatokból való kikerülésre (tartalomlopás esetén – újrapublikáltak tartalmakat az oldalunkról és nincs más eszközünk a probléma megszüntetése ellen).

Jól mutatja, hogy többnyire backlinkek alapján mérlegel a Google kérdéses esetekben, az is, hogy az ún. article site-ok, remek találati helyen szerepelnek többszörösen publikált hosszú cikkekkel is. Tehát magas Pagerankel és nagyobb bizalommal rendelkező weblapok esetén könnyebben veszi a Google a duplikált tartalmat is…

Duplikált tartalom szintjei és büntetések

  • Teljes azonosság két weboldal között: mind az url struktúra, mind a tartalom azonos a két domainen, egyetlen apró különbséget csupán a domain neve adja.
  • Struktúrális azonosság és tartalmi hasonlóság a két weboldal között: lopott tartalomból scriptekkel generált a második oldal tartalma, néhány kisebb módosításoktól eltekintve megegyezik azzal az oldalról ahonnan a lopott tartalom származik.
  • Tartalmi hasonlóság néhány oldalon: két – vagy esetleg több webes forráson is publikált tartalom – , lehetnek azonos szöveges blokkok vagy teljes tartalmi átfedés is.
  • Teljesen azonos oldal struktúra, részlegesen hasonló tartalom.

Első és második esetnél egyértelmű az esély a teljes kizárásra, hogy a klón oldal teljes tartalma eltűnjön az indexből, harmadik esetben az előző bekezdésben tárgyaltakat kell számításba venni, különböző fajtái vannak a büntetésnek, egyik az amikor elsőoldalas találatot pontosan 30 hellyel sorolja hátra a Google.
Negyedik eset ritkább történet, gondoljunk olyan esetre amikor egy már működő link-katalógus url és kategória struktúráját másolják le új link-katalógus készítésekor, egy kis munkát megspórolva, ilyen esetekben is érzékelhet a kereső duplikációt, nem kell csodálkozni, ha az elején nehezen indul el forgalom a klónozott szerkezettel bíró instant directory website…
Utóbbin túl ezernyi módja lehet még a duplikációk azonosításának, úgy mint gyanú esetén többféle lenyomatok összehasonlítása, oldalak méretének összehasonlítása, talán majd ír valaki róla egy könyvet egyszer, térjünk rá gyakorlati példákra.

Duplikált tartalom – példák

  • Multiplikált URL-ek, ugyanazon oldalra hivatkozva:

    https://www.domain.hu
    – https://www.domain.hu/index.htm
    https://domain.hu – https://domain.hu/index.htm

    Példák URL-ekre amelyek ugyanazon egy oldalra hivatkozhatnak és szerencsétlen esetben kereső a rossz linkelési technikának köszönhetően be is indexel többet vagy mindet, mert nem ismeri fel az url-ek duplikációját.
    Ezekután az oldal multiplikált url-jein “folyik szét” a Pagerank, oszlik meg a relevancia.
  • Multiplikált URL-ek, hasonló tartalommal: paramétereket tartalmazó url-ek, amelyeknél az oldal kimenete számtalan rendezési formában más, de tartalomban ugyanaz.
    Url-ben a felhasználóknak Session ID-t kölcsönző weboldalaknál hasonló a probléma.
  • “Nyomtatóbarát változat”: oldal nyomtatásra optimalizált verziója, amely tartalmában ugyanaz, csak formátumában különbözik. Ne felejtsük el ilyen oldalak esetén használni használni META tag-ek között a noindex parancsot (esetleg robots.txt)
  • Saját oldalon már megjelent cikk újrapublikálása más oldal(ak)on (pl. Wikipedia):a cikk elején már említett article site-okon való újrapublikálása egy bejegyzésünknek nem ajánlott, ha a keresők felől forgalmat várunk az adott cik révén.
  • Oldal típusának állandó sajátosságaiból adódó duplikációk: pl. webáruházak, ahol rengeteg újrapublikált termékinformáció kerül felsorolásra, halmozott hátrányt jelenthet, ha egy olyan elterjedt script alatt kerültek megvalósításra amiben SEO szempontból kritikus elemeknél nincs meg a változtatás lehetősége (Title, Description, …). Fokozottan kell ügyelni az ilyen jellegű oldalaknál a duplikációk kerülésére.
  • RSS aggregátor scriptekkel tartalmat építő oldalak: gyakori jelenség az RSS aggregátor megoldásokat alkalmazó több forrásból épülő tartalom, más oldalak (többnyire blogok) tartalmait újrapublikálása “hírgyűjtő” oldalakon. Bizonyos fokig talán ártalmatlan és felkészült a kereső az RSS elterjedése óta az ismétlődő snippetekre, de érdemes minél rövidebb tartalmat átadni a cikkből RSS-ben.
  • Lopott tartalom publikálásával duplikáció keletkezése: szó volt erről is már a cikkben, legkellemetlenebb probléma.
    A https://copyscape.com oldalon található egy online alkalmazás ami segít duplikált tartalmak felkutatásában.

Ami esetleg kimaradt arról meg majd a kommentekben.

Hasonló cikkek:

  • HTML és CSS a keresőoptimalizálás szolgálatában
  • Google algoritmus váltások
  • SEO eszközök
  • Keresőoptimalizálás

Megosztás

Rólam Longhand

21 hozzászólás

  • HSLaszlo írja:
    Jan 30 2008 9:15 am

    Ez a téma több helyen el?került, de még mindig nem tiszta: mi a helyzet az egy weboldal – több domain esetében?
    Példák:
    – ékezet nélküli és ékezetes változat,
    – elgépelésből adódó hiba kiköszöbölésére nagyon hasonló domain
    Ha végiggondolom a dolgot, akkor ha felveszem aldomainnek, tehát a “másik” domainen is elérhet? a tartalom, az duplikált. Ha átirányítom a f? domainre, az nem duplikált tartalom, hiszen a második domainen gyakorlatilag nincs tartalom.
    Jól gondolom? Mi az átirányítás seo szempontból legjobb technikája a fenti esetekben?

  • snomag írja:
    Jan 30 2008 12:06 pm

    szep osszefoglalo, grat hozza :)

    HSLaszlo: Jol gondolod, 301es atiranyitassal biztonsagban leszel es nem kell a duplikalt tartalom miatt aggodni.

  • Sziebig Péter írja:
    Jan 30 2008 1:43 pm

    Gratula,

    tökéletes összefoglaló!

    Talán ami hiányzik belőle, hogy milyen büntetésket von maga után, illetve milyen gyorsan lehet belőle kilábalni, ha megszüntetted a duplikált tartalmat ;)

  • ManiAc írja:
    Jan 30 2008 4:23 pm

    Érdemes lenne arról is írni egy cikket, hogy egy csomó írott, vagy íratlan szabály, amiről szó van itt is és más SEO -val foglalkozó blogokban, egyáltalán nem biztos, hogy kicsinyke országunk hungarian web -én is igaz.

    Duplikált tartalom? Van egy oldalam amit valaki kéretlenül lemásolt és feltöltött az atw-re. 1:1 másolatot. Az én oldalam az első a találati listán a legfontosabb kulcsszóra, a másolat meg a harmadik.

    Megkerestem ezzel az atw-t, és bár elismerték az egyezést, az oldalt nem távolítják el bírói határozat nélkül. Most komolyan… rég elavul a tartalom mire egy bírói határozat születik ebben az országban…

    Így aztán a véleményem: másoljatok nyugodtan le bármit, töltsétek fel az atw szerverére és semmi gond nem lesz.

  • Longhand írja:
    Jan 30 2008 4:44 pm

    ManiAc: az alapvető az, hogy magyarországon – szerintem – még nincs “kézi” spam sz?rés, nemzetközi szinten, főleg a globális google.com -ot illetően, a legkompetetívebb, legkiemelkedőbb kifejezésekre, kézzel gyomlálnak régóta.

    A Te esetedet illetően, ilyen példákat én is ismerek sajnos, van olyan oldal amelynek végzem az optimalizálását és teljes tükörtartalma van egy másik domainen, néhány esetben egymás közelében vannak a taláélati oldalon egy kifejezésre, mert nem ismerte fel a Google a duplikációt, ez addig megy amíg teljes ban nem lesz idővel.
    Rosszul kezeli a Google a dolgot, nem egyszer? feladat az biztos.

  • ManiAc írja:
    Jan 30 2008 7:21 pm

    Lényegében egyetértünk.

    Én úgy látom, hogy nálunk a linkfarmokért se tiltás jár, ahogy azt sok helyen írják, hanem előresorolás.
    Sok tükk van még, amit nálunk nyugodtan lehet csinálni, mindig várom mikor fognak tiltani ezekért, aztán nem nagyon változik semmi. Lehet, hogy egyszerűen kicsi ez a nyelvterület.

  • Kefe írja:
    Jan 31 2008 12:23 pm

    Long, jó a cikked!

    Szerintem egy hatékony és egyszerű megoldás lehetne a Google kezében: IP címek, IP címtartományok blokkolása EGYSZER ÉS MINDENKORRA azaz bannolás Drákói szigorral.

    A Google mi a sz@rért nem blokkolja pl. a proxy IP-k indexelését?!! A proxykon keresztül újraindexeli az egész internetet!!! A saját index adatbázisát duplázza, triplázza, sokszorozza. Újabb szerverparkokba invesztál, ahelyett hogy ésszel sz?rné a proxy-duplikált lapokat.

    Szóval mégegyszer: a Drákói szigor hiányzik, bannolás ÖRÖKRE.

    Ne félj ManiAc, ha a Google keresné meg az atw-t, hogy bannolni fogja az IP-t, ha az atw saját hatáskörben nem intézi el (tünteti el) a duplikációkat – az atw nem sz@rakodna, hanem már délutánra letörölné a webszemetet, mint a sicc, nem kellene hozzá bírói döntés…

    Én webhoszting szolgáltató is vagyok. Ha megtudnám, hogy valamelyik partnerem duplikál, úgy dobnám ki örökre, hogy a lába nem érné a földet…

    Akkor egy konstruktív javaslat: miért ne lehetne a webtárhely Szolgáltatási Szerződés része, hogy “nem helyezhet? el a tárhelyen törvénybe ütköz?, vagy duplikált tartalom, illetve rosszindulatú kód, stb…” Én biztosan a sajátom részévé teszem.

  • smuvati írja:
    Feb 1 2008 1:57 am

    A kereségi tapasztalataimra hagyatkozva, nem úgy tűnik, hogy ezek az összehasonlító algoritmusok olyan jól működnének. Mostanában is gyakran megesik, főleg a php tartalm? oldalaknál.

  • Jeremy írja:
    Feb 2 2008 12:13 pm

    Tetszett a cikked, duplikált tartalommal foglalkoztam egy ideig blackhat témakörben. Egy biztos, akik ipari méretekben csinálják, nem aggódnak érte. :D

  • gabesas írja:
    Feb 10 2008 12:11 pm

    es mivan a sajtoanyagokkal? MTI hirei(meg kb mindenfele sajtokozlemenyek) 820 peldanyban jarnak korbe szo szerint, egy betu valtoztatas nelkul.
    duplikalt tartalom valahol, lustak az ujsagirok is persze,de szerintem ez nem a szandekos rosszindulatu duplikalas esete.
    ilyenkor is szamitani lehet a buntire?

  • Longhand írja:
    Feb 10 2008 6:49 pm

    Itt is az érvényesül, hogy a magasabb bizalommal rendelkező portál simán lehet akár első is egy újrapublikált cikk tartalmával – a kiemelt kulcsszavaira, míg egy “gyengébb” portál a Google első oldalának a közelébe se fog érni.

  • Merras írja:
    Feb 13 2008 4:23 pm

    Ilyen feelingben volt élményem vica és versa is. :)

    Amikor Patai Laci elkért tőlem egy adsense-el kapcsolatos cikket a joomla blogjára, akkor a magasabb PR értéke miatt az általa újrapublikált cikk volt sokáig a top10-ben, az én blogomban lévő eredeti meg nagyjából seholse.

    Viszont volt olyan nem egyszer, hogy – valószínűleg azért, mert tematikusan relevánsabb az oldalam -, index.hu-ról kölcsönvett cikkajánlóm (egy indexes cikk első pár mondata) előrébb volt a SERPen. Mondjuk az én pár soros cikkajánlóm az jobban is optimalizált szöveg volt (heading, kiemelés, egyéb onsite technikák).

    gabesas: a sajtóanyagokkal nincs gáz. Van egy bizonyos t?résküszöbe a Googlenek is, ami a duplikált tartalmat illeti. Az a gáz, ha egy site 100%-ban duplicated contentből áll, bár ez sem egy teljesen igaz állítás. (Gondoljunk a különféle kimondottan hírajánló siteokra, vagy ahogy valaki már említette, az article directoryk sem feltétlen az egyedi anyagaikról híresek, mégis ott vannak a találati listákban.)

  • djarni írja:
    May 8 2008 5:23 pm

    És mit lehet tenni a következő esetben:

    vettem egy témát, és csináltam róla egy honlapot az extra tárhelyére, tehát ingyenes szolgáltatóra. A téma tudtam, hogy új és hamarosan nagyon ismert lesz. Annyira új, hogy a tema.hu domainje is szabad volt, csak a hibát ott vétettem, hogy nem vettem meg a domaint. Jött valaki, aki megvette tema.hu-t és egy az egyben lemásolta az oldalam. A google természetesen engem b?ntet már kb 2 hónapja, pedig megnéztem neki ninsc egy visszlinkje se, én pedig azért csináltam párat, hogy ne büntessen már a google. Azt nem látja a google, hogy a webmasters toolsba nekem előbb volt regisztrálva a honlapom, mint ahogy az ? tema.hu oldala? Pedig ennyivel el lehetne dönteni az összes ilyen duplikált tartalmat, akit b?ntetnek. Melyik oldal volt előbb, és kész, máris kiderül, ki lopta, ki nem. Egyébnként engem annyira b?ntet, ha beirom a keresőbe https://oldalam.extra.hu a találatok legvégére tesz. Ilyenkor szerintetek mi a teend?? Ja próbáltam felvenni a kapcsolatot a “lopó” oldallal, kúltúrált hangon e-mailen keresztül, de persze le se szart…

    Üdv.

  • Új link attribútum: canonical - a duplikált tartalom megelőzésére | SEO blog - Longhand írja:
    Feb 13 2009 9:26 am

    […] duplikált tartalom az egyik leggyakrabban előforduló jelenség, ami hátrányos hatással van a weboldalak […]

  • EGK írja:
    Nov 20 2009 10:25 am

    Kedves Longhand!

    Rendszeresen olvasom a blogot, nagyon jók a bejegyzések. Az lenne a kérdésem, hogy bizonyos kulcsszavakra tudjuk-e úgy erősíteni a találati helyezésünket, ha létrehozunk egy saját wiki-t (wiki.domainnev.hu), ahova feltöltünk bizonyos tartalmakat, rendszeres hivatkozásokat biztosítva a portálunkra. Ez duplikált tartalomnak minősül és büntet érte a Google?

    Előre is köszönöm!

  • Canonical attribútum immár domainek között is | SEO blog - Longhand írja:
    Dec 16 2009 12:24 am

    […] alkalmazásának a támogatását is. Február elején jelent meg új opcióként a site-on belüli duplikációk okozta hátrányok kiküszöbölésére a parancs. Immár két különböző domain alatti URL-eken […]

  • tomi írja:
    Jan 3 2010 10:23 am

    több oldalam is van, és szeretném őket megvizsgálni, hogy duplikációk vannak-e rajtuk (elsősorban a www és nem www-s eset érdekel.)
    Hol tudom ezt lekérdezni?
    üdv:T:

  • s.adam írja:
    Apr 30 2010 11:04 am

    Örülök, hogy rátaláltam erre a cikkre, nagyon hasznos volt.

    Ettől függetlenül miért kell már ide is like gomb? Mennyit profitálhat ennek elhelyezéséből egy ehhez hasonló oldal? Szerintem nem sokat, az FB viszont annál többet.

  • lovaszi írja:
    May 15 2010 5:52 pm

    Nagyon hasznos volt számomra a bejegyzés. Nem is gondoltam, hogy a duplikáció ilyen problémákat okozhat.

  • speeedfire írja:
    May 24 2010 8:24 pm

    Üdv!

    Mi van abban az esetben ha én publikáltam már tartalmakat egy nagyobb oldalra és csak később csináltam meg a saját oldalamat, ahova az eddigi tartalmaimat feltöltöttem?

    Szabi

  • Hasznaltauto írja:
    May 27 2010 9:27 am

    Sziasztok

    Elolvastam a cikket és most jövök rá, hogy az én oldalamon is elég sok diplikáció van. A segitségeteket szeretném kérni hogyan alakithatnám ki az oldalam stukturáját legelönyösebben hogy elkeülhessem a dublikációkat. Egy használtautókat hirdető oldalt csinalgatok ahol pl. egy Békés megyei opel astrát a következő oldalakon érhetek el:
    1. http://www.domain.com/ itt az összes személyautó, teherautó, potkocsi, motorkerékpár megjelenik
    2. http://www.domain.com/autok/ itt csak a személyautók jelennek meg
    3.www.domain.com/autok/opel/ itt csak az opel személyautók jelennek meg
    4.www.domain.com/autok/opel/astra/ itt csak az opel astra személyautók jelennek meg
    5.www.domain.com/autok/bekes/ itt a Békés megyei személyautók jelennek meg
    6.www.domain.com/autok/bekes/opel/ itt a Békés megyei opel személyautók jelennek meg
    7.www.domain.com/autok/bekes/opel/astra/ itt a Békés megyei opel astra személyautók jelennek meg

    Ezek szerint itt rengeteg a diblikáció.
    A google webmaster tools ban csak azok az azonos meta leirások jelennek meg amik különböző rendezési paraméterek miatt adodtak. Volt ahol a rendezéseket megszüntettem volt ahol a Link rel=”canonical”, használtam.

    Bármilyen tanacsot szivesen látok
    Tisztelettel:
    Csongi

Vélemény, hozzászólás? Válasz törlése

Az email címet nem tesszük közzé.

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Ez az oldal az Akismet szolgáltatást használja a spam csökkentésére. Ismerje meg a hozzászólás adatainak feldolgozását .

Kapcsolódó cikkek

  • HTML és CSS a keresőoptimalizálás szolgálatában A blog történetének első vendégposztja következik. Varga Bence tisztelt meg…
  • Google algoritmus váltások A 2009 előtti időszakban a Google kommunikációja minimális volt az…
  • SEO eszközök Ingyenes és fizetős eszközök, amelyek sok segítséget nyújtanak keresőoptimalizálás során. Kulcsszó kutató…
  • Keresőoptimalizálás A keresőoptimalizálás (Search Engine Optimization) stratégiai, tartalmi és technikai vonatkozásait…
  • A jó helyezés ellenségei A keresőoptimalizálás gyakorlatában a jó helyezést befolyásoló kiemelt szempontok után…

Cikk kategóriák

  • Állás (2)
  • Domain (24)
  • E-kereskedelem (5)
  • Google (44)
  • Google Analytics (14)
  • Heti termés (9)
  • Jelenségek (44)
  • Keresők (7)
  • Keresőmarketing (12)
  • Olvasói kérdések (2)
  • SEO cikkek (130)
  • UX (1)
  • Webanalitika (2)
  • Webfejlesztés (7)

Legutóbbi hozzászólások

  • Végh Győző - Kötelező biztosítás kampány, milliárdos költésekkel
  • Peter - Google Analytics: saját forgalom kiszűrése
  • Gr3nT - Google Tag Manager tanfolyam – fejlesztőknek is
  • Longhand - On-site search – Google Analytics
  • Gabrics András - On-site search – Google Analytics
  • totisti - Állás: Sanoma SEO marketing menedzser
  • SEO és branding startupoknak - Keresőoptimalizálás – Google szabadalom
  • Szendi András - Új link attribútum: canonical
  • Szépe Viktor - Híroldalak gyorsasága – 2013
  • Napi zene 15. – zencsaj • Peter Gabriel - I Grieve | STRO-B.COM | - Türk István (Moszi)

Legutóbbi bejegyzések

  • Google UX iránymutatás január 11, 2019
  • SEO analitika előadás március 3, 2016
  • Google Tag Manager tanfolyam – fejlesztőknek is április 10, 2014
  • Paid & Organic riport – értékes kulcsszó statisztikák adwordsben március 28, 2014
  • On-site search – Google Analytics március 21, 2014
  • Híroldalak gyorsasága – 2013 január 9, 2013
  • Google Analytics webfejlesztőknek december 1, 2012
  • Türk István (Moszi) szeptember 18, 2012
  • Állás: Sanoma SEO marketing menedzser június 8, 2012
  • Ha a rendszergazda nem szólt -> Robotto június 5, 2012

Kapcsolat

Email: longhand@longhand.hu
© Copyright 2020 by Longhand.hu. Minden jog fenntartva.