Jak zbieramy dane?

Sposób zbierania danych

Zestawienia tworzone są na podstawie polskich witryn, które odnotowują tygodniowo co najmniej sto odsłon o danej cesze odniesienia. Wyjątkiem są rankingi wyszukiwarek i katalogów, gdzie bazą obliczeń są wszystkie witryny bez względu na natężenie ruchu.

Dane gromadzone są dzięki zastosowaniu skryptów badawczych umieszczonych w źródłach stron korzystających z badania gemiusTraffic, które następnie są przekazywane do centralnej bazy obliczeniowej. Strony internetowe badane w ramach gemiusTraffic pełnią rolę "receptorów" w internecie – gromadzą dane, które po zagregowaniu stanowią podstawę obliczania rankingów.

Za każdym razem, gdy przeglądarka pobiera odpowiednią stronę objętą badaniem, automatycznie przekazywane są informacje do serwera gemiusTraffic m.in. o wersji przeglądarki i systemu operacyjnego, dane pozwalające na identyfikację rozdzielczości monitora, a także adres IP komputera użytkownika stanowiący podstawę do geolokalizacji użytkowników.

Dane uzyskane na polskich stronach internetowych objętych badaniem gemiusTraffic są podzielone na dwie grupy: dane pochodzące od użytkowników łączących się z terytorium Polski oraz pochodzące od użytkowników łączących się z polskimi witrynami spoza terytorium Polski. Dane wygenerowane przez użytkowników łączących się z polskimi witrynami spoza terytorium polski są wykorzystywane jedynie do przygotowania rankingu krajów z których internauci łączą się z polskimi witrynami. Następie dane są przeliczane i publikowane na łamach serwisu gemiusRanking PL.

TYP BADANIA: SITE-CENTRIC

Badanie typu site-centric polega na tworzeniu paneli witryn, a dane dotyczące aktywności użytkownika zbierane są przez serwer, na którym znajduje się dana strona WWW.

Dla porównania, w badaniu typu user-centric tworzone są panele użytkowników, natomiast dane będące podstawą analiz statystycznych podawane są przez samych internautów.

W jaki sposób się to dzieje? Kiedy wchodzimy na daną stronę internetową, np. wpisując jej adres URL w okienku adresowym przeglądarki, nasza przeglądarka przekazuje do serwera, na którym znajduje się strona, prośbę o przesłanie kodu HTML witryny. W kolejnym kroku pobiera elementy składające się na stronę (np. pliki graficzne). Z każdym takim połączeniem przeglądarka przekazuje zbiór technicznych informacji, które stanowią podstawę badania.

KTO JEST BADANY?

Grupa poddawana badaniom to wszyscy internauci, którzy odwiedzają losowo wybrane polskie strony korzystające z badania gemiusTraffic.

Użytkownicy identyfikowani są na bazie plików cookie przypisanych do profilu przeglądarki. Oznacza to, że jednego użytkownika (cookie) nie można utożsamiać z jedną rzeczywistą osobą korzystającą z sieci. W przypadku, kiedy internauta używa kilku przeglądarek na jednym komputerze, to pod każdą będzie rozpoznawany jako inny użytkownik (cookie). Jeżeli łączy się siecią z różnych komputerów, np. na uczelni, w pracy, w domu, w każdym miejscu będzie widziany przez system jako odrębny użytkownik (cookie). Możliwa jest również sytuacja odwrotna, kiedy to kilka osób korzysta z jednego profilu przeglądarki - wtedy ich zachowania oraz dane techniczne komputera i przeglądarki będą rozpoznawane jako zachowania i dane jednego użytkownika (cookie).

Co istotne, dane stanowiące podstawę rankingów są generowane jedynie przez internautów – ludzi, a eliminowane są np. wejścia dokonywane przez indeksujące strony roboty wyszukiwarek.

Powrót na górę strony

Web Statistics