A felhasználók internetes keresési szokásairól és keresések karakterisztikájáról készített tanulmányt nemrégiben a pennsylvaniai és queenslandi egyetemek három kutatója. A tanulmányhoz három különböző kereső 5 millió keresést tartalmazó logjait használták fel.
A tanulmány két fő fázisból állt, első szakaszban a keresési típusok klasszifikációja történt a fentiekben leírt mennyiségű logok tanulmányozása alapján, második szakaszban pedig az első szakaszban definiált típusok arányainak megállapítása egy a Dogpile
kereső tranzakciós logjait feldolgozó alkalmazás kimenete alapján.
A keresések jellegét az alábbiak szerint határozták meg a tanulmányban a logok analizálása alapján:
Célirányos keresések
- a keresés cég/alapítvány/személy nevet tartalmaz
- a keresés domain végződést tartalmaz
- kevesebb mint 3 kifejezést tartalmazó keresés
- a felhasználó csak az első találati oldalt tekinti meg
Tranzakciós keresés
- filmek, zenék, dalok, recept, humor, pornó témaköréhez kapcsolódó kifejezések használata a keresésben
- keresés tartalmazza magát a keresés tárgyának típusát is (pl. film, zene)
- keresés tartalmazza a “letöltés” kifejezést
- kép, hang, video gyűjteményekhez kapcsolódó kifejezések használata a keresésben
- “kép”, “hang”, “video” szavakat tartalmazó keresések
- szórakozással, kikapcsolódással kapcsolatos kifejezések használata (pl. játék, képek)
- interaktiv tevékenységeket jelölő kifejezések (pl. vásárlás, chat)
- fájltípus kiterjesztését tartalmazó keresések (pl. .jpg, .zip)
Információ keresés
- kérdő szavakat használó keresések (pl. “mi”, “hogyan”, “merre”)
- keresés természetes nyelvi kifejezésekkel
- informatív szavakat használó keresések (pl. list (lista), playlist(lejátszási lista))
- keresések amelyek után a felhasználó több találati oldalt megtekintett
- keresések amelyek egy korábbi keresésen túliak, annak folyományai
- kettőnél több kifejezés/szó használata a keresésben
- keresések amelyek nem felelnek meg a célirányos és tranzakciós
- keresések kritériumainak így nemsorolhatóak oda.
Az első két kategória könnyebben behatárolható és felismerhető a jellegéből fakadóan, gyors kevés kifejezést tartalmazó keresések, általában hamar az első keresés után befejeződnek. Célirányos keresésben a keresések néha a céldomain nevét is tartalmazzák, valamint a cégek, márkák, egyesületek nevét tartalmazó kulcsszavak egyértelműen kifejezik, hogy a keresés célja egy konkrét weboldal megtalálása.
Második kategória a tranzakciós keresések elsősorban a keresésben használt kifejezések és találatokból kiválasztott tartalmak (online shop-ok és szórakoztató jellegű tartalommal rendelkező weboldalak) összevetése alapján került azonosításra.
Harmadik kategória az információ keresés már egy nem annyira karakteres keresési fajta.
A kutatás második szakaszában a Dogpile logok feldolgozása után az alábbi eredmények születtek, a keresések jellegét illetően:
Információ keresés 1,228,427 – 80.6%
Célirányos keresés 155,628 – 10.2%
Tranzakciós keresés 139,738 – 9.2%
Összesen 1,523,793 – 100.0%
Korábbi hasonló kutatásokhoz viszonyítva az információ keresések száma magasabb lett (korábbi kutatásokra való hivatkozások megtalálhatóak a lentebb linkelt két dokuentumban).
Érdekes adatok még a keresések száma egy session-ön belül valamint a megtekintett találatok számának aránya egy lekérdezés után:
Keresések száma
1 keresés – 288,231 – 53.9%
2 keresés – 88,875 – 16.6%
3 keresés – 47,664 – 8.9%
4 keresés – 29,345 – 5.4%
5 keresés – 19,655 – 3.6%
6 keresés – 13,325 – 2.4%
7 keresés – 9,549 – 1.7%
8 keresés – 7,169 – 1.3%
9 keresés – 5,497 – 1.0%
10 keresés – 4,130 – 0.8%
Megtekintett találatok száma
1 oldal – 1,052,554 – 69.07%
2 oldal – 253,718 – 16.6%
3 oldal – 104,233 6.8%
A tanulmányok angol nyelvű anyaga letölthető az alábbi címen PDF formátumban:
Determining the User Intent of Web Search Engine Queries