Der Umzug auf eine neue Domain sollte immer mit einer passenden 301 Weiterleitung verbunden sein. Mit einer einfachen HTACCESS Weiterleitung auf die neue Domain über „Redirect 301“ ist die Arbeit aber nicht getan, da somit viel „Linkjuice“ verloren geht und zudem während der Umstellung Besucher die über Google kommen immer auf die Startseite der neuen Seite geworfen werden. Damit verliert man wichtige Klicks, Google benötigt zudem länger um die neue Seite in den Index aufzunehmen. Abhilfe schafft eine genaue Weiterleitung von jeder Seite auf Ihre neue Adresse. Bei mehreren hundert wenn nicht sogar tausende Seiten stößt man dabei recht schnell an ein Limit. Tausende Links von Hand weiterzuleiten macht keinen Spaß und verschlingt zudem viel Arbeitszeit die für lukrativere Dinge genutzt werden kann.
[symple_highlight color=“blue“]Eines gleich Vorweg, wer nichts mit Programmiersprachen am Hut hat und eine schnelle Lösung benötigt, kann sich gerne an mich wenden. Da so gut wie jedes CMS-System Sitemaps generiert, kann ich den SEO tauglichen Umzug per HTACCESS für Sie übernehmen. Ein kurzes Mail oder ein Anruf genügt für weitere Informationen. Individualisierte Lösungen, sofern keine Sitemap verfügbar ist, übernehme ich natürlich auch gerne.[/symple_highlight]
Kommen wir zum eingemachten. Wie der Titel schon sagt, verfolgen wir in dieser Anleitung eine Lösung die über Python realisiert wird. Als Editor verwende ich Pycharm welches in der Community-Edition kostenlos erhältlich ist. Nachdem Pycharm installiert wurde, benötigen wir noch das zusätzliche und natürlich auch kostenlose BeautifulSoap. Dieses Package verwenden wir um die heruntergeladene XML-Datei auszulesen. Wir könnten an dieser Stelle natürlich auch mit einem XML Interpreter arbeiten, mir persönlich gefällt BeautifulSoap aber besser, Verbesserungsvorschläge passen also perfekt in den Kommentarbereich. BeautifulSoap kann man über „File“ -> „Settings“ -> Project: DeinProjektName hinzufügen. Klickt hierfür im Untermenü einfach auf das grüne Plus und sucht BeautifulSoap aus der Liste. Zusätzlich benötigen wir das „requests“ Package, dieses könnt Ihr an dieser Stelle auch direkt installieren.
Nun erstellen wir eine neue Python-Datei im Editor und importieren BeautifulSoup. Die Sitemap Datei mit allen Links der alten Domain legen wir ins Hauptverzeichnis unseres Projekts ab. In den Ordner eures PyCharm Projekts gelangt Ihr über die linke Leiste. Ein Rechtsklick auf den Namen des Projekts gefolgt von einem Klick auf „Copy Path“ legt euch den genauen Pfad zum Ordner in die Zwischenablage.
Kommen wir zum Code, bitte beachtet die Kommentare für weitere Infos.
from bs4 import BeautifulSoup import requests def seoredirect(): # Alte Adresse oldadress = 'https://vaporizenow.eu' # Neue Adresse newadress = 'https://vaporizershop.at' # Sitemap Adresse sitemap = 'https://vaporizenow.eu/sitemap.xml' # Ab hier muss nichts mehr geändert werden source_code = requests.get(sitemap) plain_text = source_code.text soup = BeautifulSoup(plain_text, "html.parser") print('RewriteEngine on') # Counts the Results we get for link in soup.findAll('loc'): theurl = str(link.string) theurl = theurl.replace(oldadress, '') if theurl == '/': print('Redirect 301 ' + oldadress + ' ' + newadress) else: print('Redirect 301 ' + theurl + ' ' + newadress + theurl) seoredirect()
In Pycharm muss das Script jetzt einfach ausgeführt werden. Die Ausgabe könnt Ihr anschließend beginnend mit „RewriteEngine on“ kopieren und in eure HTACCESS Datei einfügen.