Beiträge von Marvin Jörs

Keyword-Clustering mit dem Levenshtein-Algorithmus

Teil des intern verwendeten Data Mining Boards ist das Keyword-Clustering, das auf dem Levenshtein-Algorithmus basiert. Was sich im Zuge eines SEO-Audits als einmalige Fleißarbeit betiteln lässt, wird bei der Analyse von wöchentlichen und anders getakteten Reportings zu einer zeitaufwendigen Herausforderung. Der Levenshtein-Algorithmus kann ein grobes, aber automatisiertes Keyword-Clustering im Vorfeld erzeugen, sodass bei drei- bis…

Weiterlesen

Zeitreihenzerlegung von Google Search Console Daten

Möchte man Aussagen über den zukünftigen Klickverlauf treffen, so erschwert der (saisonal) schwankende Zeitreihenverlauf oftmals die genaue Prognose. Wendet man typische Schätzverfahren an, so sind diese in der Regel nicht effizient. Ein Verfahren aus dem Bestandsmanagement schafft einen Lösungsansatz – für additive und multiplikative Saisonalität.  

Weiterlesen

ROTL-Strategie (Rest-On-The-Laurels-Strategie) | Manipulation im E-Commerce

Reputationssysteme im E-Commerce setzen auf die algorithmische Verarbeitung von Vergangenheitsdaten, d.h. die Berechnung von Reputationswerten erfolgt logischerweise auf Signalen der Vergangenheit. Ein Ruf lässt sich nur schwer vorhersagen. Eine geplante Verhaltensänderung im Zuge der ROTL-Strategie ist demnach nur schwer zu messen. Die genannte Lösung ist mehr als fraglich.

Weiterlesen

Bayessche Conversion Rate Optimierung

Conversion Rate Optimierung nach Bayesscher Statistik kam bereits 2013 einmal auf. Damals hat Chris Stucchio in seinem Beitrag dargelegt, wie man mithilfe von Wahrscheinlichkeitsverteilungen die Optimierung von CTR-Raten realisieren kann.

Weiterlesen

Multikollinearität im Datenmodell | Online Marketing Basics

Multikollinearität kann im eigenen Regressionsmodell dazu führen, dass eine Schätzung nicht möglich ist. Bei starker Multikollinearität drohen rissige Schätzungen. Statistik-Software in R streicht bspw. bei Vorliegen von perfekter Multikollinearität Variablen aus der Schätzung. Variablenunterdrückung kann ein Mittel sein. So lässt sich Multikollinearität erkennen.

Weiterlesen

Digitale Warenkorb-Analyse durch multiple Regression

Ursprünglich war der Einsatz von bestehenden Python-Bibliotheken zur Durchführung einer multiplen Regression auf verschiedene digitale Metriken vorgesehen. Danach hat’s aber so sehr Spaß gemacht, da habe ich die Regressionsberechnung und viele Untersuchungsmethodiken in Python einfach eigenhändig umgesetzt.

Weiterlesen