♥ werbe- und trackerfrei.

Self Made WordPress Exporter und Takte zur Content Analyse

Für eine Überarbeitung bestehender WordPress Beiträge wollte ich die Beiträge sorgenfrei in ein anderes System exportieren, um dort Änderungen an den Inhalten vorzunehmen. Normalerweise kann man das auch direkt im aktiven WordPress Backend einer Seite erledigen. Nur waren dabei auch Plugin-Tests und diverse Selfmade-Algorithmen im Spiel, die man lieber nicht am Live-System ausprobiert. Das nötige Python-Skript für einen Export lässt beliebige WordPress Blogs in ein WordPress-System transferieren. Die Struktur des Python Notebooks erlaubt auch zusätzliche Addons.

Export vorbereiten: WordPress lokal installieren (empfohlen)

Beim Programmieren einer automatisierten Content Analyse von bestehenden WordPress Beiträgen, ist der Exporter an sich als Kuppelprodukt entstanden. Mit dem Exporter kann der RSS-Feed eines beliebigen WordPress Blogs ausgelesen und in ein WordPress System importiert werden.

Grundsätzlich: Wo das System letztendlich installiert wird, ist egal. Egal wird es dann nicht, wenn man die Sicherheitsfrage stellt. Aus Sicherheitsgründen empfehle ich ausdrücklich den Import in ein geschütztes Backend auf einer Subdomain (Blockieren Sie Suchmaschinen und externe Zugriffe). Das Skript verwendet einen Zugang per xmlrpc.php. Es ist bekannt, dass dies ein Sicherheitsrisiko darstellt. Eine lokale WordPress-Installation per XAMP, MAMP oder wie sie auch immer heißen mögen, wird empfohlen.

Das Skript für einen schnellen WordPress Export

🔥 Im ersten Schritt müssen die Daten eingegeben werden:

Falls es keinen Client gibt zum Bearbeiten und Ausführen von Jupyter Notebooks (Ich empfehle an dieser Stelle dringend Anaconda), dann kann das auch als einfaches Python-Skript ausgeführt werden. Diese Libraries müssen installiert werden:

Nun zum Code. Im ersten Schritt muss man selbst aktiv werden. Die folgenden Daten müssen hinterlegt werden:

Dieser Abschnitt bereitet eine Duplikatsprüfung vor. Damit nicht Duplikate im Backend landen, ziehe ich mir die aktuellen Beiträge aus dem Backend und integriere eine Funktionsaufruf später in der Import-Funktion, um Duplikate zu vermeiden.

Damit wir auch alle Artikel erhalten, loope ich über eine einfache Variable i über die Paginierung des RSS-Feeds.

Im nächsten Abschnitt werden die Artikel in das Backend importiert:

Am Schluss wird eine Tabelle exemplarisch generiert, die Daten zu den Beiträgen präsentiert. In der Version auf Github sind drei Standard-Abfragen implementiert.

RSS Export für WordPress

Weitere Untersuchungsmetriken sind beispielsweise:

  • Termfrequenzen im Textkorpus
  • Anzahl der Wörter im Textkorpus (muss um HTML-Tags bereinigt werden!!!)
  • Anzahl der Elemente zählen (img, p,..)
  • Anzahl der Links innerhalb des Textkorpus
  • In Kombination mit SERP Scrapern inverse Frequenzen berechnen
  • Berechnung von Linkprofilen untereinander

Das Jupyter Notebook gibt’s hier github.com/onlinemarketingscience/wordpress-exporter.

Gründer von onlinemarketingscience.com, Student der Wirtschaftsinformatik und Gründer der Skyscraper Marketing UG in Frankfurt.

Ich interessiere mich vor allem für Themen wie Big Data, Data Science, neuronale Netze, Business Process Optimization im Online-Geschäft und natürlich SEO (Suchmaschinenoptimierung).

  Subscribe  
Benachrichtige mich zu: