Wenn bei Ihnen die in meiner Webseite verwendeten Bilder nicht angezeigt werden, sondern stattdessen lediglich das Ersatzbild ausgegeben wird, dann liegt das daran, daß Ihr Webbrowser keine Referrer überträgt, Sie ein Filterprogramm wie Webwasher oder ähnliches verwenden oder Ihr Internetzugang über einen sogenannten Proxyserver hergestellt ist, der die Referrer entfernt. Bisher können nur Opera, Netscape 7 und Mozilla / Firefox die Übertragung der Referrer selbst verhindern. Zu finden ist diese Option bei Opera (7.11) unter „Einstellungen“ (Alt+P), „Datenschutz“, „Protokollierung der URL-Referenzen ermöglichen“. Filterprogramme kann man in der Regel auch so konfigurieren, daß sie die Referrer durchlassen.
Referrer geben darüber Auskunft, woher der Aufruf einer Datei kommt. Die aufrufende Datei kann eine Datei der eigenen Webseite sein, aber auch eine einer anderen Webseite, die einen Verweis zur eigenen Seite enthält. Bei Bilddateien gibt der Referrer in gleicher Weise darüber Aufschluß, von welcher Datei aus die betreffende Bilddatei aufgerufen wurde. In den Protokolldateien (Logs) des Webservers werden diese Angaben gespeichert und dienen dann beispielsweise dazu, eine Zugriffsstatistik zu erstellen, der man dann auch entnehmen kann woher die Besucher gekommen sind.
Vor einiger Zeit mußte ich feststellen, daß jemand versucht hat auf einen Schlag alle Bildteile der auf meiner Seite einsehbaren Stadtpläne und Karten in je einer entsprechend vorbereiteten HTML-Datei darzustellen, auch so etwas sieht man im Serverlog. Deswegen habe ich das jetzt so konfiguriert, daß die Karten-Bilddateien nur noch bei Zugriff durch Dateien, die zu meiner eigenen Webseite gehören ausgegeben werden. Das wird eben mithilfe des Referrers festgestellt. Wird der nicht übertragen, so werden die Bilddateien nicht ausgegeben.
In den Logs wird jeder Dateizugriff in einer neuen Zeile notiert. Welche Angaben gespeichert werden, hängt von der Konfiguration des Webservers ab. Diese Einstellungen kann jedoch nur der Webhoster anpassen, wenn man wie ich keinen eigenen Server hat. Zur Erläuterung mögen die beiden folgenden Beispiele aus meinem Serverlog dienen. Das erste zeigt einen Seitenzugriff mit, das zweite ohne Referrerübertragung.
Beispiel 1 195.37.166.231 - - [02/Nov/2004:11:20:02 +0100] "GET /stw/drg.html HTTP/1.0" 200 1912 "http://www.blocksignal.de/indexn.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 4.0)" 195.37.166.231 - - [02/Nov/2004:11:20:02 +0100] "GET /stw/drgn.html HTTP/1.0" 200 2619 "http://www.blocksignal.de/stw/drg.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 4.0)" 195.37.166.231 - - [02/Nov/2004:11:20:02 +0100] "GET /stw/drgs.html HTTP/1.0" 200 34401 "http://www.blocksignal.de/stw/drg.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 4.0)" 195.37.166.231 - - [02/Nov/2004:11:20:02 +0100] "GET /stw/drg/lat1k.jpg HTTP/1.0" 200 6814 "http://www.blocksignal.de/stw/drgs.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 4.0)" Beispiel 2 80.140.50.36 - - [01/Nov/2004:14:17:05 +0100] "GET /stw/drg.html HTTP/1.1" 304 - "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; DigExt)" 80.140.50.36 - - [01/Nov/2004:14:17:05 +0100] "GET /stw/drgn.html HTTP/1.1" 304 - "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; DigExt)" 80.140.50.36 - - [01/Nov/2004:14:17:05 +0100] "GET /stw/drgs.html HTTP/1.1" 304 - "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; DigExt)" 80.140.50.36 - - [01/Nov/2004:14:17:05 +0100] "GET /stw/drg/lat4k.jpg HTTP/1.1" 403 528 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; DigExt)"
Bedeutung der einzelnen Angaben
195.37.166.231 | – | Die IP-Adresse des aufrufenden Rechners, die bei den meisten Surfern beim Verbindungsaufbau in das Internet dynamisch vom Provider zugewiesen wird und sich deshalb in der Regel mit jeder neuen Einwahl ändert. Anstelle der IP kann hier auch der ebenfalls dynamisch vergebene Rechnername stehen, was ich aber in der Realität noch nie gesehen habe. Weder der Webseitenbetreiber noch der Hoster können anhand der IP eine Zuordnung zu einer natürlichen Person treffen. Das ist nur über den Provider des Besuchers nach Anordnung der Ermittlungsbehörden möglich. | ||||||||||
- - | – | Anstelle der beiden Striche können hier noch der Anwendername gemäß RFC 931 sowie ein vom Anwender selbst vergebener Anwendername stehen. Der Server meines Hosters speichert diese Angaben jedoch nicht. | ||||||||||
[02/Nov/2004:11:20:02 +0100] | – | Datum, Uhrzeit und Zeitzone des Zugriffs, +0100 steht dabei für + 1 Stunde gegenüber GMT, also MEZ. | ||||||||||
GET /stw/drg.html HTTP/1.0 | – | GET: Methode des Zugriffs; angeforderte Datei und Protokoll. | ||||||||||
200 | – | Statuscode, der über das Ergebnis des Zugriffs Auskunft gibt. Es bedeuten beispielsweise:
| ||||||||||
1912 | – | Anzahl der übertragenen Bytes | ||||||||||
http://www.blocksignal.de/indexn.html | – | Das ist nun der Referrer. Er zeigt, von wo aus die Datei, auf die zugegriffen werden soll, aufgerufen wurde. Das kann eine Datei der eigenen Webseite sein, aber auch eine Datei einer anderen Webseite, in der ein entsprechender Verweis vorhanden ist. Bei Zugriffen, die von Suchmaschinen kommen, enthält der Referrer in den angehängten Parametern oft auch die Suchbegriffe. | ||||||||||
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 4.0) | – | Angaben zur Version des Browsers. Hier finden sich gegebenenfalls auch Einträge der Suchprogramme von Suchmaschinen. |
Im ersten Beispiel hat ein Besucher meiner Webseite im Inhaltsverzeichnis (indexn.html) der Startseite auf das Thema Lichttagessignale geklickt, wodurch (damals noch) das Frameset drg.html für dieses Thema angefordert wurde. Dieses Frameset hat zwei weitere Dateien angefordert, die Textseite drgs.html und das entsprechende Inhaltsverzeichnis (Navigation) drgn.html zu dem aufgerufenen Thema. Die Textseite hat wiederum eine Bilddatei lat1k.jpg angefordert. So setzt sich das dann fort, bis die ganze Seite aufgebaut ist und alle Bestandteile angezeigt werden.
Im zweiten Beispiel hat ein Besucher, der diese Seite bereits einmal gesehen hat, die gleiche Seite erneut aufgerufen. Seit dem letzten Zugriff wurde die Seite nicht geändert, weswegen der Statuscode 304 zurückgegeben wurde. Der folgende Strich zeigt an, daß außer der Anforderung keine Daten übertragen wurden (0 Bytes). Die Seite wurde vom Browser des Besuchers mithilfe der beim letzten Besuch im sogenannten Cache des Browsers gespeicherten Daten dargestellt. Der folgende Strich steht an der Stelle, an der der Referrer zu finden wäre, wenn er denn übertragen worden wäre. Weil er fehlt, wurde die nachfolgende Anforderung der Bilddatei mit Statuscode 403 quittiert und das angeforderte Bild nicht übertragen.
Der Referrer dient wie oben beschrieben dazu, zu erkennen woher die Besucher der eigenen Seite kommen. Das ist schließlich auch legitim. Den allenthalben zu lesenden Vorwurf, man könne damit Nutzerprofile erstellen, kann ich nicht recht nachvollziehen. Das würde erfordern, daß man erkennen kann wohin der Besucher entschwunden ist wenn er die betreffende Seite verläßt. Wenn man die Spur eines Surfers durch das WWW verfolgen wollte, wäre es dann aber viel besser, Zugriff auf möglichst viele Logs im WWW zu haben. Das kann man jedoch ausschließen. Derartigen Zugriff haben bestenfalls die großen Webhoster, die jedoch damit rechnen müßten ihre Kunden zu verlieren wenn das bekannt würde. Außerdem steht im Referrer nur woher der Besucher kam und nicht etwa wie er heißt und wo er wohnt. Wie oben geschildert, sind darüber hinaus nur die IP-Adresse und die Browserkennung in der Log-Datei vorhanden.
Neben den im Log zu findenden Angaben wie IP, Browserversion und Betriebssystem lassen sich jedoch eine Reihe weiterer Daten mit entsprechend vorbereiteten Webseiten sammeln, vor allem dann, wenn im Browser Javascript aktiviert ist und Cookies akzeptiert werden. Wer also das Datensammeln erschweren möchte, wäre folglich besser beraten Javascript abzuschalten und bestimmte Cookies abzulehnen. Weitere Informationen dazu sind leicht zu finden, wenn man eine Suchmaschine mit den Begriffen Javascript, Nutzerprofil und Sicherheit füttert. Da Javascript auch wegen der immer wieder bekannt werdenden Sicherheitslücken der Browser von vielen abgeschaltet wird und textbasierte Browser für die Ausgabe per Braillezeile Javascript ohnehin nicht verarbeiten, ist es allerdings ärgerlich, daß auf vielen Webseiten grundlegende Funktionen wie die Navigation ohne Not mit Javascript realisiert werden. Weshalb muß beispielsweise ein anzuzeigendes Bild in einem neuen, der Größe angepaßten Fenster geöffnet werden? Ich empfinde das als Bevormundung, schließlich bestimme zunächstmal ich selbst, welche Fenster ich auf meinem Bildschirm haben will und welche nicht.
Mißbrauch mit den Referrern wird aber auf andere Weise betrieben, nämlich indem die Logs mit manipulierten Referrern gefüttert werden. Sieht der Webseitenbetreiber seine Statistik durch, so landet er, wenn er nachsehen will woher seine Besucher kamen, auf der Seite des Spammers. Vergleichbar lästig wie E-Mail-Spam wird das Referrerspamming für die Betreiber von Weblogs / Blogs, die dort anzeigen von welchen Seiten die meisten Besucher auf ihr Blog kommen. Das bringt dem Betreiber ohne Arbeitsaufwand Verweise zu anderen Seiten und zeigt dem Besucher, wem das Blog einen Verweis wert war. Der Spammer erhofft sich davon zwei Effekte. Zum einen führt er so ahnungslose Blogbesucher auf seine Seite, zum anderen erhöht sich so die Anzahl der auf seine Seite zeigenden Verweise, was gegebenenfalls zu einer besseren Bewertung bei Suchmaschinen führt. Das gleiche Problem kann bei Gästebüchern auftreten, die dem Besucher die Möglichkeit bieten eine Homepage einzutragen. Beides ist jedoch kein Grund für den normalen Webseitenbesucher die Referrer zu unterdrücken, schließlich wird der Webseitenbetreiber damit belästigt.
English summary
If you do not see the pictures used in my web page, but instead a replacement picture is only spent, then that is because of the fact that your webbrowser does not transfer referrer or you use a filter program like Webwasher or an proxy, which filters. So far the Opera browser, Mozilla and Netscape 7 can prevent the transmission of the referrer. This option is in Opera (7.11) to find under "Preferences" (Alt+P), "Datasecurity", "Logging of the URL references makes possible". With the other browsern this option is present, but not available in the preferences dialog. Filter programs can be configured in such a way that they let the referrer through.
Referrers give informations from where the call of a file comes. That shows, by which other file from the file is called. The calling file can be a file of the own web page or one another web page, which contains a URL to the own side. With image files the referrer shows likewise, from which file the image file was called. In the log files of the web server these data are stored and serve then e.g. to provide an access statistics the more state than the pure access numbers.
How I had to determine some time ago, someone has all picture parts of the city plans and maps observable on my side to download tried at one time - that is also in a statistics to see -, I that had in such a way configured now that the image files only with access by files, which belong to my own web page are spent. That is determined evenly on the basis the referrers. If that is not transferred, then the image files are not spent.
Translated with babelfish :)