Tomek
01.04.2005, 14:30
Hallo,
ich habe seit einigen Tagen die Datei robots.txt nach einigem Recherchieren verändert. Für alle die jetzt mit der robots.txt nichts anfangen können, gibt es u.a. hier (http://www.searchcode.de/artikel/robotstxt.php) eine Beschreibung.
Dadurch ergeben sich folgende Vorteile:
bessere Suchergebnisse, da die Suchmaschinen ausschliesslich Themen und Beiträge indizieren
weniger Netzwerkverkehr (Traffic), da die Suchmaschinen unnötige Seiten nicht aufrufen
geringere Serverlast, da Suchmaschinen unnötige Seiten nicht aufrufen und unnötige Funktionen, wie z.B. das Suchen im Forum, nicht benutzen
Die robots.txt mit Erklärung zu den einzelnen Optionen:
User-agent: * # gilt für alle Suchmaschinen
Disallow: /vb/admincp/ # Suchmaschinen haben hier nichts zu suchen
Disallow: /vb/modcp/ # Suchmaschinen haben hier nichts zu suchen
Disallow: /vb/faq.php # das Indizieren der vB-FAQ ist unnötig
Disallow: /vb/attachment.php # Was sollen Suchmaschinen mit Anhängen anfangen?
Disallow: /vb/avatar.php # Avatar-Funktionen bringen der Suchmaschine nichts
Disallow: /vb/cron.php # Links zur cron.php sollen die Suchmaschinen nicht aufrufen
Disallow: /vb/editpost.php # Suchmaschinen brauchen nicht versuchen Beiträge zu ändern
Disallow: /vb/calendar.php # das Indizieren des Kalenders ist unnötig
Disallow: /vb/member.php # das Indizieren des Benutzerprofils ist unnötig
Disallow: /vb/memberlist.php # das Indizieren der Benutzerliste ist unnötig
Disallow: /vb/printthread.php # Suchmaschine soll und braucht nicht die Druckversion eines Themas indizieren
Disallow: /vb/sendmessage.php # Suchmaschinen sollen keine Nachrichten verschicken
Disallow: /vb/register.php # Suchmaschinen sollen sich nicht registrieren
Disallow: /vb/sendtofriend.php # Suchmaschinen sollen Themen nicht versenden
Disallow: /vb/login.php # Suchmaschinen brauchen sich nicht einzuloggen
Disallow: /vb/newreply.php # Suchmaschinen sollen nicht versuchen zu antworten
Disallow: /vb/newthread.php # Suchmaschinen sollen nicht versuchen neue Themen zu erstellen
Disallow: /vb/online.php # Suchmaschinen sollen "Wer ist online"-Seite nicht indizieren
Disallow: /vb/search.php # Suchmaschinen sollen im Forum nicht die Suchfunktion bemühen
Disallow: /vb/subscription.php # auch hier hat eine Suchmaschine nichts verloren
Disallow: /vb/threadrate.php # Suchmaschinen sollen keine Themen bewerten
Disallow: /vb/private.php # Suchmaschinen sollen keine private Nachrichten versenden
Disallow: /vb/misc.php # Suchmaschinen benötigen keine Funktionen aus der misc.php
Disallow: /vb/poll.php # Suchmaschinen sollen nicht an Umfragen teilnehmen
Disallow: /vb/showpost.php # Suchmaschinen sollen nicht einen einzelnen Beitrag, sondern das gesamte Thema indizieren
Disallow: /vb/profile.php # Suchmaschinen benötigen keine Funktionen der Benutzerprofile
Disallow: /vb/usercp.php # Suchmaschinen sollen nicht auf das Benutzerkontrollzentrum zugreifen
Disallow: /vb/showgroups.php # das Indizieren der Foren-Mitarbeiter ist unnötig
User-Agent: Googlebot-Image # gilt nur für die Google-Image-Suchmaschine
Disallow: / # Bilder und Grafiken sollen nicht indiziert werden
Das Pfadangaben müssen natürlich angepasst werden, z.B. /forum/ anstatt /vb/. Nach dieser Änderung, indizieren die Suchmaschinen lediglich das Forum-Archiv, die Startseite sowie alle Themen und Beiträge.
Wenn ihr die robots.txt einsetzt oder verändert, kann es u.U. bis zu einem Tag dauern, bis die Suchmaschinen diese Datei erneut auslesen. Ich habe beobachtet, dass der Yahoo-Bot vor jeder Such-Session die robots.txt liest und der MSN-Bot mehrmals täglich. Der Google-Bot hingegen liest die Datei etwas seltener.
Nach dem Suchmaschinen aber die Datei einmal gelesen haben, halten sie sich auch strikt daran. Diese Erfahrung habe ich mit MSN, Yahoo und Google machen können. Ob sich irgendwelche andere Suchmaschinen nicht daran halten, kann ich bisher nicht sagen.
Verbesserungsvorschläge, Fragen oder auch Kritik sind gern willkommen.
ich habe seit einigen Tagen die Datei robots.txt nach einigem Recherchieren verändert. Für alle die jetzt mit der robots.txt nichts anfangen können, gibt es u.a. hier (http://www.searchcode.de/artikel/robotstxt.php) eine Beschreibung.
Dadurch ergeben sich folgende Vorteile:
bessere Suchergebnisse, da die Suchmaschinen ausschliesslich Themen und Beiträge indizieren
weniger Netzwerkverkehr (Traffic), da die Suchmaschinen unnötige Seiten nicht aufrufen
geringere Serverlast, da Suchmaschinen unnötige Seiten nicht aufrufen und unnötige Funktionen, wie z.B. das Suchen im Forum, nicht benutzen
Die robots.txt mit Erklärung zu den einzelnen Optionen:
User-agent: * # gilt für alle Suchmaschinen
Disallow: /vb/admincp/ # Suchmaschinen haben hier nichts zu suchen
Disallow: /vb/modcp/ # Suchmaschinen haben hier nichts zu suchen
Disallow: /vb/faq.php # das Indizieren der vB-FAQ ist unnötig
Disallow: /vb/attachment.php # Was sollen Suchmaschinen mit Anhängen anfangen?
Disallow: /vb/avatar.php # Avatar-Funktionen bringen der Suchmaschine nichts
Disallow: /vb/cron.php # Links zur cron.php sollen die Suchmaschinen nicht aufrufen
Disallow: /vb/editpost.php # Suchmaschinen brauchen nicht versuchen Beiträge zu ändern
Disallow: /vb/calendar.php # das Indizieren des Kalenders ist unnötig
Disallow: /vb/member.php # das Indizieren des Benutzerprofils ist unnötig
Disallow: /vb/memberlist.php # das Indizieren der Benutzerliste ist unnötig
Disallow: /vb/printthread.php # Suchmaschine soll und braucht nicht die Druckversion eines Themas indizieren
Disallow: /vb/sendmessage.php # Suchmaschinen sollen keine Nachrichten verschicken
Disallow: /vb/register.php # Suchmaschinen sollen sich nicht registrieren
Disallow: /vb/sendtofriend.php # Suchmaschinen sollen Themen nicht versenden
Disallow: /vb/login.php # Suchmaschinen brauchen sich nicht einzuloggen
Disallow: /vb/newreply.php # Suchmaschinen sollen nicht versuchen zu antworten
Disallow: /vb/newthread.php # Suchmaschinen sollen nicht versuchen neue Themen zu erstellen
Disallow: /vb/online.php # Suchmaschinen sollen "Wer ist online"-Seite nicht indizieren
Disallow: /vb/search.php # Suchmaschinen sollen im Forum nicht die Suchfunktion bemühen
Disallow: /vb/subscription.php # auch hier hat eine Suchmaschine nichts verloren
Disallow: /vb/threadrate.php # Suchmaschinen sollen keine Themen bewerten
Disallow: /vb/private.php # Suchmaschinen sollen keine private Nachrichten versenden
Disallow: /vb/misc.php # Suchmaschinen benötigen keine Funktionen aus der misc.php
Disallow: /vb/poll.php # Suchmaschinen sollen nicht an Umfragen teilnehmen
Disallow: /vb/showpost.php # Suchmaschinen sollen nicht einen einzelnen Beitrag, sondern das gesamte Thema indizieren
Disallow: /vb/profile.php # Suchmaschinen benötigen keine Funktionen der Benutzerprofile
Disallow: /vb/usercp.php # Suchmaschinen sollen nicht auf das Benutzerkontrollzentrum zugreifen
Disallow: /vb/showgroups.php # das Indizieren der Foren-Mitarbeiter ist unnötig
User-Agent: Googlebot-Image # gilt nur für die Google-Image-Suchmaschine
Disallow: / # Bilder und Grafiken sollen nicht indiziert werden
Das Pfadangaben müssen natürlich angepasst werden, z.B. /forum/ anstatt /vb/. Nach dieser Änderung, indizieren die Suchmaschinen lediglich das Forum-Archiv, die Startseite sowie alle Themen und Beiträge.
Wenn ihr die robots.txt einsetzt oder verändert, kann es u.U. bis zu einem Tag dauern, bis die Suchmaschinen diese Datei erneut auslesen. Ich habe beobachtet, dass der Yahoo-Bot vor jeder Such-Session die robots.txt liest und der MSN-Bot mehrmals täglich. Der Google-Bot hingegen liest die Datei etwas seltener.
Nach dem Suchmaschinen aber die Datei einmal gelesen haben, halten sie sich auch strikt daran. Diese Erfahrung habe ich mit MSN, Yahoo und Google machen können. Ob sich irgendwelche andere Suchmaschinen nicht daran halten, kann ich bisher nicht sagen.
Verbesserungsvorschläge, Fragen oder auch Kritik sind gern willkommen.