Kennzahlen der Statistik | Online Marketing Python Code Snippets

Die Daten der Google Search Console lassen sich sehr komfortabel über die API (in Python) ins eigene Data Warehouse exportieren. Wieso sich die Mühe machen, wenn das Dashboard bereits komfortabel in der Bedienung ist und mir ein Export geboten wird? Zumal man sich unter der Verwendung der Filter die Verkehrsdaten nach Intention zusammenklicken kann.

Die Daten sind rückblickend nur für die letzten neunzig Tage verfügbar. Wer langfristige Entwicklungen beobachten will, sollte sich über die Einrichtung eines eigenen Data Warehouses Gedanken machen. Mit Python kann dieses Vorhaben zügig umgesetzt werden.

Im Folgenden möchte ich auf die Idee eines unserer Data Science Skripts eingehen, die statistische Kennzahlen auf Basis eines bestimmten API-Response der Google Search Analytics API produziert. In ein .csv gepackt, kann das Sheet direkt für weitere Zwecke (Monitoring, Weitergabe) verwendet werden.

Voraussetzungen für die Benutzung der Google Search Analytics API

  1. Installation der Python Client Library
  2. Anlegen eines neuen Projekts auf der Google Cloud Platform und die Aktivierung der Google Search Console API
  3. In der Google API Console müssen Zugangsdaten erstellt werden. Der Typ ist hier OAuth 2.0 Client ID, da ein Zugriff auf die Google Search Console Daten nur unter Voraussetzung einer entsprechenden Authentifizierung erfolgen darf. Der Anwendungstyp ist Sonstiges.
  4. Diese Zugangsdaten müssen in die Datei client_secrets.json hineinkopiert werden. Beim Durchstöbern der API-Beispiele auf dem Github-Account von Google findet man diese Datei mit im Beispielsordner der entsprechenden API.

Die Skripte werden dann über eigene Konsole aufgerufen. Software wie Anaconda kann auch hier natürlich verwendet werden.

Statistische Kennzahlen aus den Google Search Daten bilden

Python bietet bereits eine entsprechende Palette an Funktionen zur Berechnung von statistischen Kennzahlen. Über import statistics werden die Funktion nutzbar gemacht. Im Folgenden möchte ich das Skript vorstellen, das für gegebene Google Search Console Daten nützliche Kennziffern der Statistik in ein .csv exportiert.

Statistik für Google Search Console Daten

Wir verwenden die klassischen KPIs der Google Search Console und betrachten Sie auf der Datum-Dimension. Im Folgenden möchte ich die Code-Bestandteile ein wenig erläutern.

Du möchtest direkt zum Skript und es testen? Dann geht’s hier lang: Direkt zum Skript: Google Search Console + Statistik

Die oberen Import’s sind systembedingt und müssen importiert werden. Mit statistics importieren wir uns bequem die gängigen Statistik Funktionen. Nachzulesen auch gerne hier.

Die Zeilen 16-47 sind 1:1 aus dem API-Sample entnommen. Hier werden die Eingaben der Konsole gespeichert und der entsprechende Request vorbereitet:

Das gewählte Start- und Enddatum wird dynamisch über die Eingabe als Request versendet. Wir setzen grundsätzlich die Dimension auf date, d.h. wir möchten die Metriken anhand der Daten, der Tage innerhalb des Zeitraums, aufgelistet bekommen.

Zwei wichtige Funktionen: Parse_Output und Quick_Math

Wir deklarieren vier leere Arrays, die den Namen der bekannten Metriken tragen. Sollte die Response leer sein, so werden wir über einen Konsolen-Print darüber informiert. Meistens ist dort ein zu weit in der Vergangenheit liegender Zeitraum gewählt oder eine falsche Property-URL, über die Sie keine Daten verfügen, eingetragen.

Ansonsten iterieren wir über diese Daten und fügen die Metriken unseren Arrays hinzu. Danach rufen wir die quick_math-Funktion auf allen Arrays auf. Hier hätte man, aufgrund der endlichen und einheitlichen Array-Anzahl einen vierfachen Parameter-Aufruf und somit nur einen Funktionsaufruf wählen können.

Die Funktion nimmt sich das Array und wendet zunächst über eine map-Funktion auf alle Array-Werte ein float-Cast an. Das ist ausschließlich präventiv. Auf dem Array rufen wir nun die Funktionen der Library statistics auf und speichern uns die Ergebnisse in einem neuen Array. Auch hier könnte man mit anderen Speichermethoden herangehen – so ist es sehr einfach. Die Daten werden letztendlich per .write-Funktion in unsere .csv-Datei geschrieben. Hierbei müssen wir . durch , ersetzen, da es sonst zu Darstellungsfehlern kommt.

Die Funktion Modus scheint noch nicht richtig zu wollen. Auch hier bin ich dran, das Problem zeitnahe zu lösen.

Python-Skript für statistische Zahlen (GSC-Daten) herunterladen

Das Python-Skript ist auf dem Github-Account von OnlineMarketingScience.com zu finden.

Marvin Jörs

Gründer von onlinemarketingscience.com, Student der Wirtschaftsinformatik und Gründer der Skyscraper Marketing UG in Frankfurt. Ich interessiere mich vor allem für Themen wie Big Data, Data Science, neuronale Netze, Business Process Optimization im Online-Geschäft und natürlich SEO (Suchmaschinenoptimierung).

Hallo Nutzer

destructed

Marvin / geb. 1994 / Studium der Wirtschaftsinformatik (TU Darmstadt) / Gründer