Detailierte 301 Weiterleitungen über Sitemap generieren

Der Umzug auf eine neue Domain sollte immer mit einer passenden 301 Weiterleitung verbunden sein. Mit einer einfachen HTACCESS Weiterleitung auf die neue  Domain über „Redirect  301“ ist die Arbeit aber nicht getan, da somit viel „Linkjuice“ verloren geht und zudem während der Umstellung Besucher die über Google kommen immer auf die Startseite der neuen Seite geworfen werden. Damit verliert man wichtige Klicks, Google benötigt zudem länger um die neue Seite in den Index aufzunehmen. Abhilfe schafft eine genaue Weiterleitung von jeder Seite  auf Ihre neue Adresse. Bei mehreren hundert wenn nicht sogar tausende Seiten stößt man dabei recht schnell an ein Limit.  Tausende Links von Hand weiterzuleiten macht keinen Spaß und verschlingt zudem viel  Arbeitszeit die für lukrativere Dinge genutzt werden kann.

[symple_highlight color=“blue“]Eines gleich Vorweg, wer nichts mit Programmiersprachen am Hut hat und eine schnelle Lösung benötigt, kann sich gerne an mich wenden. Da so gut wie jedes CMS-System Sitemaps generiert, kann ich den SEO tauglichen Umzug per HTACCESS für Sie übernehmen. Ein kurzes Mail oder ein Anruf genügt für weitere Informationen. Individualisierte Lösungen, sofern keine Sitemap verfügbar ist, übernehme ich natürlich auch gerne.[/symple_highlight]

Kommen wir zum eingemachten. Wie der Titel schon sagt, verfolgen wir in dieser Anleitung eine Lösung die über Python realisiert wird. Als Editor verwende ich Pycharm welches in der Community-Edition kostenlos erhältlich ist. Nachdem Pycharm installiert wurde, benötigen wir noch das zusätzliche und natürlich auch kostenlose BeautifulSoap. Dieses Package verwenden wir um die heruntergeladene XML-Datei auszulesen. Wir könnten an dieser Stelle natürlich auch mit einem XML Interpreter arbeiten, mir persönlich gefällt BeautifulSoap aber besser, Verbesserungsvorschläge passen also perfekt in den Kommentarbereich. BeautifulSoap kann man über „File“ -> „Settings“ -> Project: DeinProjektName hinzufügen. Klickt hierfür im Untermenü einfach auf das grüne Plus und sucht BeautifulSoap aus der Liste. Zusätzlich benötigen wir das „requests“ Package, dieses könnt Ihr an dieser Stelle auch direkt installieren.

Nun erstellen wir eine neue Python-Datei im Editor und importieren BeautifulSoup. Die Sitemap Datei mit allen Links der alten Domain legen wir ins Hauptverzeichnis unseres Projekts ab. In den Ordner eures PyCharm Projekts gelangt Ihr über die linke Leiste. Ein Rechtsklick auf den Namen des Projekts gefolgt von einem Klick auf „Copy Path“ legt euch den genauen Pfad zum Ordner in die Zwischenablage.

Kommen wir zum Code, bitte beachtet die Kommentare für weitere Infos.

from bs4 import BeautifulSoup
import requests

def seoredirect():

    # Alte Adresse
    oldadress = 'https://vaporizenow.eu'

    # Neue Adresse
    newadress = 'https://vaporizershop.at'

    # Sitemap Adresse
    sitemap = 'https://vaporizenow.eu/sitemap.xml'

    # Ab hier muss nichts mehr geändert werden
    source_code = requests.get(sitemap)
    plain_text = source_code.text
    soup = BeautifulSoup(plain_text, "html.parser")

    print('RewriteEngine on')

    # Counts the Results we get
    for link in soup.findAll('loc'):
        theurl = str(link.string)
        theurl = theurl.replace(oldadress, '')
        if theurl  == '/':
            print('Redirect 301 ' + oldadress + ' ' + newadress)
        else:
            print('Redirect 301 ' + theurl + ' ' + newadress + theurl)


seoredirect()

In Pycharm muss das Script jetzt einfach ausgeführt werden. Die Ausgabe könnt Ihr anschließend beginnend mit „RewriteEngine on“ kopieren und in eure HTACCESS Datei einfügen.