Naponta többmilliárd lekérdezést feldolgozó keresők számára mint a Google, nagyon sokat segíthet tartalmak közötti eligazodásban és rangsorolásban, egy jó struktúrára épülő, okosan feldolgozott query log statisztika.
Egy szabadalmat olvasok query adatok többdimenziós rendezéséről, amely alapján, a lekérdezés dátumát, földrajzi paramétereit is figyelembe véve épül a statisztika, egyedi felhasználók többszöri keresését query sessiononként elkülönítve.
A szabadalmat nem olvastam végig, mert untatott a hosszúra nyúlt iPod keresés példa, de továbbgondoltam néhány dologban mennyire jól jön az ilyen többdimenziós statisztika:
- egy ilyen szintű feldolgozás milyen nagy segítséget jelenthet lokális jellegű keresésekben, ahol egy-egy kifejezés saját külön értelemmel bírhat.
- egy azonos kifejezésre épülő, egymásra hasonlító query sessionökből, olyan mintákat készíthet a kereső (szép long tail-ekből) , amelyet a rangsorolt dokumentumok tartalmait összehasonlítva, nagyon jó kiindulás lehet a megfelelő dokumentumok kiválasztására.
Talán mégsem lesz annyira elveszve a Google a jövőben lokális keresésben mint azt korábban gondoltam.
(azért azt mondom továbbra is, ez az amiben verhető lesz/lenne…)
Nincs hozzászólás