Neu hier? Abonnieren Sie doch gleich den RSS feed um nichts zu verpassen.
Da ich einige Zeit gebraucht habe um die Google Sitemaps bei mir zum laufen zu bringen, schreibe ich mal eine Anleitung für alle die einen Server bei Domainfactory stehen haben. Sollte aber auch bei anderen Providern funktionieren.
- Python Sitemap Generator downloaden
- example_config.xml in config.xml umbennen und mit sitemap_gen.py irgendwo auf dem Webserver ablegen, bsp: Domain.de/sitemapgenerator
- In der config.xml bei base_url die URL eingeben bsp: http://www.usability-now.com/ bei store_into den vollen Pfad des Webserver wo die XML Datei abgelegt werden soll (über PHPInfo findet man den Pfad leichter). Also steht da am Ende sowas wie:
<site base_url=”http://www.usability-now.com/” store_into=”/kunde/668899/webseiten/usability-now.com/sitemap.xml.gz” verbose=”3″>
<directory path=”/kunden/668899/webseiten/usability-now.com” url=”http://www.usability-now.com/” default_file=”index.php” />
<accesslog path=”/kunden/668899/logs/usability-now.com*” encoding=”UTF-8″ />
Der Teil /kunden/668899/webseiten/ muss natürlich auf die eigene Konfiguration angepasst werden.
- Da das ganze jetzt noch automatisiert laufen soll und ihr die Sitemap nicht jedesmal per Hand erstellen wollt, bauen wir jetzt noch eine PHP Datei die Sitemap zusammenbaut und Google berscheid gibt, dass diese neu erstellt wurde. Sowas makesitemap.php anlegen und ebenfalls im Ordner Domain.de/sitemapgenerator ablegen.
Dort einfach folgenden PHP-Code einbauen exec('python sitemap_gen.py --config=config.xml',$output,$return);
echo $return;
echo $output; Der die Sitemap erstellt, noch mal alles auf dem Webserver hochladen und die URL Domain.de/sitemapgenerator/makesitemap.php im Browser aufrufen, wenn alles geklappt hat, sollte im Root eures Webservers bzw. unter der URL Domain.de/sitemap.xml.gz eine URL zu finden sein.
- Falls noch nicht geschehen, eigene Konto bei Google Sitemaps anlegen und Sitemap für die Domain einrichten.
- Cron Job einrichten der jede Nacht das makesitemap.php Skript aufruft.
Was passiert denn da jetzt eigentlich?
Mit base_url bekommt das Sitemap Tool die URL mit. directory path zeigt dem Python die Dateistruktur so kann das Tool auch Dateien finden die schlecht oder nicht verlinkt sind (wer alle Dateien ausschließen möchte die zB admin enthalten, der fügt einfach <filter action=”drop” type=”wildcard” pattern=”*admin*” /> in die config.xml ein). Und mit accesslog hat das Python Tool zugriff auf die Logfiles und entscheidet je nachdem wie oft auf eine Datei zugegriffen wurde, welche priority diese in der Sitemap bekommt. Das ist gegenüber den ganzen Online Generatoren ein echter Vorteil da diese nur eine Standard oder gar keine Priorität vergeben.
Wer Probleme mit der Einrichtugn der Sitemap hat Verbesserungsvorschläge hat, kann ja einfach einen Kommentar schreiben.
Dieser Beitrag wurde am Dienstag, 08. Mai 2007 um 16:42 Uhr veröffentlicht und wurde unter der Kategorie
Webmaster abgelegt. Du kannst die Kommentare zu diesen Eintrag durch den
RSS-Feed verfolgen. Du hast die Möglichkeit einen
Kommentar zu hinterlassen, oder einen
Trackback von deinem Weblog zu senden.
Super Anleitung.
Aber heut zu tage wird fast bei jedem Auftritt ein CMS benutzt und logischer Weise, die CMS selbst oder durch Erweiterungen ohne Probleme den Map erstellen.
Kommentar: Panthera-IT – 09. Februar 2008 @ 12:01 pm
Hallo, ich verstehe beim Punkt 3 den store_into
nicht???
Habe auf dem Server alles in htdocs/sitemapgenerator gespeichert.
Ich danke Dir für Deine Hilfe
Gruss
Rolf
Kommentar: Traber – 01. Mai 2008 @ 3:31 pm
Das ist falsch das muß der Lokale Pfad deines webservers hin wo die sitemap abgelegt wird wird. ZB
htdocs/sitemap.xml.gz
Kommentar: admin – 02. Mai 2008 @ 6:30 pm