Site icon Longhand

A keresők működése

Korábban ha valaki a kereső technológiák iránt érdeklődve azt kérdezte tőlem, hogy mit érdemes elolvasni a témában, mindig egy pár évvel ezelőtt írt ~500 oldalas könyvet ajánlottam, inkább “olvasgatásra”.

Pár hete találkoztam két Google mérnök által készített 24 oldalas publikációval, ami könnyebben emészthető, tömörebb anyag, érdemes végigolvasni mindenkinek akit szakmailag komolyabban érdekelnek a keresők:

Indexing the World Wide Web: The Journey So Far (PDF)

Google doksi, de nemcsak a Google keresőről esik szó benne, hanem egyéb konkurensekről és újabb keresőkről is (pl. Blekko, Cuil, Powerset), plusz az elején egy történelmi bevezetés a keresők fejlődéstörténetéről.
Jól érthetően elmagyarázza a webes dokumentumok indexelése során felvetődő technikai kihívásokat és a megoldási formákat, az invertált indexelés működését, a kulcsszavak és kifejezések alapján történő indexelést, a kapcsolódó hardveres megoldásokat.
A közösségi portálokhoz kapcsolódó rangsorolási kérdésekkel is foglalkozik az utolsó fejezet.

A dokumentum abban is segítséget nyújthat tágabb körök számára, hogy megértsük egy webes kereső a legtöbb fejlesztéssel járó nagyon komplex szoftveres és hardveres megoldásokat igénylő alkalmazás és miért érdemes gyanakodni, ha váratlanul felbukkanó Google-killernek kikiáltott keresővel találkozunk.

A Google research -ön sok érdekes publikáció található még IR témájában, akit érdekelnek a kereső technológiák érdemes körülnéznie.

A bejegyzés elején említett hosszabb anyag: An Introduction to Information Retrieval

Exit mobile version