Content scraper site-oknak hívják azokat a weboldalakat amelyek más oldalak tartalmait összegyűjtve építenek új portált, új struktúrában esetleg, de hozzáadott plusz tartalom nélkül.
Kicsi az olyan oldalak százalékos aránya a weben, amelyek teljesen egyedi tartalmat közölnek folyamatosan, ezen kevesek közé tartoznak a saját cikkeket publikáló hírportáljaink mint az Index.hu, ahol nagyon sok új tartalom készül napi szinten.
Most úgy látszik ők is elkezdtek contentet duplikálni jól, “erősebb kutya baszik” elv alapján hátha hozzájuk hozza a Gugle majd az usert egynéhány keresésre.
Nem tudom mióta léteznek adatlap címszó alatt tartalmak az Index kultúr rovatában, én csak most vettem észre egy cikkben lévő hivatkozás nyomán, de azt látni, hogy közel 800.000 ilyen oldal szerepel a Google indexben.
Az oldalak többnyire színészek, filmek, tv műsorok bemutató adatlapjai, az a közös bennük, hogy szinte mind a Port.hu oldal leírásaival 100%-osan megegyező szövegek.
Jogi hátteret nem ismerem, valószínűleg a Port.hu szerkesztői sem maguk írják a rövid bemutatókat a filmek esetén, tehát nem saját tartalmuk, hanem gyártók által kiadott sajtóanyagok ezek minden valószínűséggel, amelyek újrapublikálhatóak bárki által, tehát nem követ el vétséget azzal senki, ha a közzéteszi.
(voltak olyan tartalmak is, amit csak a port.hu és az index.hu oldalán találtam meg
pl. DunaTV kívánságkosár: https://index.hu/kultur/musor/adatlap/70168 – https://www.port.hu/pls/fi/films.film_page?i_perf_id=7547142&i_where=1)
Viszont negatív jelenség számomra, hogy nagyobb portálok is, ahelyett, hogy olyan hasznos forrásokra mutatnának (jelen esetben a port.hu) amelyek jól teljesítik a szerepüket, elkezdik ilyen megoldásokkal inkább “haza hordani” a látogatókat saját oldalaikra.
Adott színész, film, műsor említése során, port.hu hivatkozás helyett, az onnan átvett tartalom jelenik meg saját oldalon.
20 hozzászólás
“Viszont negatív jelenség számomra, hogy nagyobb portálok is, ahelyett, hogy olyan hasznos forrásokra mutatnának (jelen esetben a port.hu) amelyek jól teljesítik a szerepüket,”
Ez akkor történne így, ha a port.hu fizetne azoknak az erős oldalaknak, akik meglinkelik, és sok látogatót hoznak.
Valószínűleg a port nem fizet ilyesmiért, akkor pedig az index és a többiek miért tennének jót velük ingyen, ha ugyanazt az anyagot maguk is megjelentethetik, és kereshetnek rajta?
A kapitalizmus nem a szívjóságról szól.
Nem jószív?ség kérdése.
Ne linkelje, ha úgy ítéli, hogy nem érdemes. Nem kötelez?.
(Egészségesebb egyébként az a gyakorlat, hogy relevánsabb forrásokat megjelelölünk esetenként. Jó a felhasználó számára, jó a keresők számára, erre is gondolni kell.)
Szerintem az Indexnek a jellegéből fakadóan nem lenne szüksége ilyen tartalmak behúzására, sokkal értékesebb maradhatna a saját szerkesztői és az olvasók által (ahogy egyre jobban integrálódik a blog.hu is) el?állított tartalmakból készült értékek létrehozásával.
Legszörny?bb a “content scrape” olyankor, amikor ténylegesen segítségre van szükségem és külföldön nagyon sok “tech oldal” simán csak átveszi a fórumokból a (sokszor nem éppen hozzáért? kommentel?ktől jövő) hozzászólást, mint ha az a saját megoldása lenne egy adott problémára. Nem egyszer előfordult, hogy az első 2-3 találati oldalon minden egyes találatra dettó ugyanaz a szöveg jön be más köntösben (és persze más reklámmal vagy “popunderrel”). A találat ugyan tényleg a keresésre ill?, de sok esetben már nem tudom jobban sz?kíteni a keresést ha a segítségért gugli barátomhoz fordulok.
Origo?
Ha valaki elárulja miért sikeresebb a rosszabb strukturával rendelkező origo mint az index, az kap egy s?rt!
(szvsz: aki már tud netelni indexet olvas, aki alap az meg origot, persze vannak átcsurgások, de javába inkább ezvan)
Index.hu szinten tényleg nem kellene, ez inkább a megélhetési webmesterek m?faja (akik lehet, hogy gyakran nem is kicsit jól élnek meg ebből :) )
Sajnos sok esetben mindkét oldalon elég gyenge minőség? írások születnek meg, mivel az előzményekre nem figyelnek, illetve nem járják körül a témát. Ami még feltűnt már elég régóta, hogy eléggé el ment a bulvár felé, azért ez az ?skorban nem volt (2000 elött)
Az idex mostanában folyamatosan degradálja magát. Ezzel még jobban eligénytelenedik. Sok panaszt hallok mostanában, több ismerős?m levette az RSS-ről mert azt mondták, lassan az lesz a neve, hogy “Blikk”….
Amig nem lesz “igazi” verseny ezen a szegmensen, addig ez a kett? mamut marad.
Ráadásul szinte minden cikkben van egy-egy elgépelés… de nekem összességében tetszik.
muhaha, jó ez a post, a gonosz index behúzza szegény port.hu adatait. lol. valójában az index fizet ezekért az adatokért a portnak, ilyen egyszer?.
no, egy bennfentes válaszolt netán? :)
Jólvan apafej, akárhogy is van, baszott rossz tartalom építési stratégia IMHO, az Indextől.
Ha még fizet is érte, akkor meg pláne.
(btw. nemcsak port.hu tartalmaival azonos duplikált tartalmak találhatóak Index “adatlapokon”, ezért falsnak tűnik kicsit ez az “info”)
Egyébként olyan édes, hogy mennyien aggódnak azon, hogy mit csinál az index.hu…
Gondolom van náluk felel?se a témának és valószínűleg átgondolják, hogy mit miért csinálnak, ha meg tévednek… az ? gondjuk :)
Én nem aggódom rajta különösképpen, csak tényleg meglepetésként ért amikor a napokban rábukkantam ezekre az adatlapokra és tartottam annyira rossz lépésnek, hogy írjak róla egy külön bejegyzést.
Szerintem az érték és a minőség fontos lenne, ha az ilyen nagy portálok egyáltalában fontosnak tartják, ha ezek nem képesek közvetíteni akkor, a régi látogatói rétegből veszít és veszíteni fog és egy másfajta látogatói réteg lesz. Az írásokat igen sokan “értékelik” az origon, talán az index még nem meri bevállalni, hogy hozzászólhassanak a tartalomhoz.
Kissé pofátlanság az efféle automatizált tartalommásolás. Nem, mint ha a kézzel történő másolás nem lenne az. Sokan most azt mondják: “Ehh, így kell okosan lopni, automatikusan”. Én másképp látom. Ha már lopsz, “dolgozz” meg érte. Grrrrrrrr . Index.hu, grrrrrrr.
Talán ezzel összefügg, és nem véletlen, hogy egy negyedéven át az Index pagerank-je nulla volt.
Az egy technikai jellegű probléma volt mint utólag kiderült. Az index.hu/index.html léte okozta a zavart, mert néha az Index erre a címre szokta átirányítani a felhasználókat amikor belépési oldal előtti reklám van.
A Port.hu meg a Moziplussz.hu-tól lop időnként tartalmakat, úgyhogy ez inkább ilyen belterjes, spóroljunk a munkával kör.
amatőr kérdés:
egy olyan portálnak mint az index mennyire számít a pr ?
azt gondolná az ember hogy valaki vagy ismeri (internettó óta) vagy nem, vagy ez nem így van ?
nehéz a kérdésedre jó és jól fogalmazott választ adni kerecsen malac :)