Apache Log Zugriffe von m.facebook.com analysieren

Bei einer Analyse von Zugriffen auf einer meiner Webseiten, ist mir ein seltsames Verhalten von Besuchern / Nicht-Besuchern über m.facebook.com aufgefallen. Für einen bestimmten Artikel, den ich am selben Tag auf einer Facebook Seite geteilt hatte, wurde im Apache Webserver Log zwar Zugriffe verzeichnet, aber Google Analytics erfasste diese Zugriffe nicht im Echtzeit-Report, auch nicht einen Tag später im normalen Report.

„GET /geteilterartikel.html HTTP/1.1“ 200 6604 „http://m.facebook.com/“

Zur Kontrolle habe ich ein zusätzliches Tracking mit Piwik eingebaut und im Google Analytics den Ausschluss meiner eigenen IP-Adresse entfernt um gleichzeitig die Apache Logs, Google Analytics und Piwik beobachten zu können. Es zeigte sich, dass bei den meisten verzeichneten Zugriffen von m.facebook.com weder Analytics noch Piwik auslösten. Gerade bei Piwik sieht man im zugehörigen Apache Log genau, wann das Tracking Tool mit Daten gefüttert wird.

Anmerkung: Der betreffende Artikel erreichte in dem überprüften Zeitraum auf der Facebook Seite eine Reichweite von etwas mehr als 4500 Personen. Laut Facebook Statistik wurde der Beitrag 81 mal angeklickt. Im Apache Log wurden rund 1000 Hits mit dem Referrer m.facebook.com verzeichnet.

Google Analytics Tracking überprüft

Tracking Code im HEAD Bereich eingebunden?

Ja. Alle eigenen Zugriffe über PC oder das Galaxy S4 Android Smartphone lösten erfolgreich das Tracking bei beiden Tools aus. Ebenso der Testzugriff über die Google Analytics Weboberfläche.

GA Debugger für Chrome und Firefox

Die Erweiterungen Google Analytics Debugger und Tag Assistant (by Google) für Chrome beziehungsweise HttpFox für Firefox zeigten die an Analytics übermittelten Daten korrekt an.

Einen Tag später erkannte ich ein grundlegendes Versäumnis bei der Analyse vom Apache Log. Anfangs filterte ich der Übersicht-halber per grep nur auf die .html URL des untersuchten Artikels (also ohne anderen Elemente, die beim Aufruf einer Webseite noch geladen werden wie Bilder und CSS-Dateien) und übersah dabei, dass bei genau diesen Einträge von m.facebook.com im Apache Log, die kein Tracking auslösten, die zugehörigen IP-Adressen gar keine weiteren Dateien vom Server für eine korrekte Anzeige der Seite luden.

Facebook App verantwortlich?

Bei einem Test mit der Facebook App am Android Smartphone konnte ich mindestens einmal das Verhalten nachproduzieren, indem ich mit der App zum geteilten Artikel auf der Facebook Seite scrollte ohne dieses anzuklicken. Wieder der Eintrag im Log

xxx.xxx.xxx.xxx – – [28/May/2016:10:04:57 +0200] „GET /geteilterartikel.html HTTP/1.1“ 200 6604 „http://m.facebook.com/“ „Mozilla/5.0 (Linux; Android 5.0.1; GT-I9505 Build/LRX22x; wv) AppleWebKit/537.xx (KHTML, like Gecko) Version/4.0 Chrome/50.0.2661.xx Mobile Safari/537.xx“

Die offene Frage

Warum gibt es unter den oben genannten Bedingungen überhaupt einen Aufruf der Webseite aus dem Facebook Netzwerk? Lässt Facebook ihre App nur die HTML Datei ohne Javascript & Bilder laden, weil das Titelbild bereits im Facebook Cache vorliegt?

Das Verhalten trifft auch auf weitere Domains zu.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.