Tipps für die such­ma­schi­nen­ge­rech­te Ge­stal­tung von Web­si­tes - ohne faule Tricks

Home

1. Worum geht es?

2. Inhalte Ihrer Site

3. Technische Realisierung und HTML-Code

3.1 Falle: Javascript

3.2 Falle: Graphiken und Flash

3.3 Falle: Frames

3.4 Sinnvoll aber auch möglicherweise eine Falle: dynamische Inhalte

3.5 Falle: nicht konstante URL für einen bestimmten Inhalt

3.6 Machen Sie es anderen leicht, auf Seiten in Ihrer Website zu linken

3.7 Nicht zu empfehlen: proprietäre Dateiformate wie Winword oder PowerPoint

3.8 Schädlich: Inhaltsleere Eingangsseiten (splash screens).

3.9 Kein Allheilmittel, aber auch nicht zu vernachlässigen: Metatags.

3.10 Unerlässlich: der <title>-Tag

3.11 Nicht vergessen: Links zur Homepage von allen Seiten.

3.12 Hilfreich auch für Sie: barrierefreies Webdesign

3.13 Auswahl des Webhosters

3.14 Klare Entscheidung nötig: URL mit oder ohne Subdomain 'www.'?

4. Meine Site ist fertig - kann ich sie jetzt für Suchmaschinen anmelden?

5. Jetzt ist meine Site aber wirklich fertig. Was jetzt?

6. Meine Site ist suchmaschinenfreundlich und angemeldet - was nun?

7 Exkurse: Einige Gesichtspunkte, die nicht direkt die suchmaschinengerechte Gestaltung betreffen.

Schlüssel zu den Auszeichnungen im Text:

Negativbeispiele Beispiele Nützliche und weiterführende Websites

3. Technische Reali­sie­rung und HTML-Code

Um Ihre Webseiten suchmaschinenfreundlich erstellen zu können

SELFHTML ist ein ausgezeichnetes Online-Lehr- und Nachschlagwerk zur HTML-Erstellung für Selbstdenker. Sie können die komplette Site auch downloaden (gut 7 MByte) und auf Ihrem PC speichern, dann geht das Blättern zwischen verschiedenen Seiten schneller. Das Ganze gibt es auch als Buch (für das Lesen im Bus oder in der Badewanne doch praktischer als eine Website.).
HTML. Kurz und gut. von Jennifer Niederst ist eine Kurzreferenz im Miniformat, die neben jeder Tastatur noch Platz findet.
Websites mit Informationen zu allen Aspekten der Websiteerstellung.
Der Artikel Wie Vertrauen auf den HTML-Editor die Suchmaschinen-Position ruiniert von Klaus Schallhorn geht darauf ein, warum Selbstdenken besser ist als die gedankenlose Nutzung eines WYSIWYG-Editors.

Das WWW-Horrorkabinett von Christoph Schneegans enthält eine große Anzahl von abschreckenden Beispielen. Unter den Sites, die von inkompetenten Webdesignern zu für einen Teil der Webnutzer und meistens auch für Suchmaschinenzwecke unbrauchbar

3.1 Falle: Javascript

Wenn Sie Javascript verwenden, kann das für die Aufnahme Ihrer Website in den Datenbestand von Suchmaschinen folgende nachteilige Folgen haben:

Grundsätziche Regel: Die Spider von Suchmaschinen führen keinen Javascript-Code aus. Sie verhalten sich also wie ein Besucher, der auf seinem Browser Javascript deaktiviert hat.

Deshalb sollten Sie, wenn Ihre Seiten bei den Spidern der Suchmaschinen Gnade finden sollen:

  1. am besten: kein Javascript verwenden. Überprüfen sie, ob das, was Sie mit Javascript bewirken, nicht eher eine Spielerei ist. Außerdem kann vieles, was gängig mit Javascript erledigt wird, auch serverseitig realisiert werden.
  2. Wenn Sie doch nicht auf Javascript verzichten wollen: es jedenfalls nicht für Links zur Navigation innerhalb Ihrer Website einsetzen.. Auf jeden Fall müssen Sie Ihre Website mit einem Browser überprüfen, bei dem Javascript ausgeschaltet ist.
    Ob Sie Javascript bei Ihrem Browser erfolgreich ausgeschaltet haben, können Sie in der folgenden Zeile überprüfen:
    In Ihrem Browser ist Javascript derzeit nicht aktiviert oder aber Ihr Browser unterstützt Javascript generell nicht. Sie können mit diesem Browser in dieser Einstellung ausprobieren, ob Ihre Website (insbesondere hinsichtlich der Links) auch ohne Javascript funktioniert.

Die Website eines Vereins, der lieber ungenannt bleiben soll, hat eine Version der Site mit Internet-Explorer-Extras für die Navigation und eine Version für andere Browsers. Die Unterscheidung geschieht über eine Zwischenseite, auf der ein Javascript-Programm je nach Browsertyp auf die Internet-Explorer-Version oder auf die andere Version umleitet.

Dies geschah auf der genannten Zwischenseite mit dem HTML-Konstrukt:

<html>
<head>
... (u.a. Definition der Javascript-Funktion zum Laden der einen oder anderen Seite, abhängig vom Browser)
</head>
</body onLoad="Aufruf der Javascript-Funktion">
</body>
</html>

Was beim Überprüfen der Site übersehen wurde: Browser ohne Javascript/mit ausgeschaltetem Javascript sahen auf dieser Zwischenseite nur ein leeres Fenster. Desgleichen Suchmaschinen: für sie war diese Seite inhaltslos und enthielt auch keinen weiterführenden Verweis.

Auf meinen Hinweis hin wurde, als provisorische Lösung um die Site nicht grundlegend umbauen zu müssen, auf der Zwischenseite innerhalb von <noscript>-Tags ein normaler Link angebracht, der von Suchmaschinen und auch von allen Browsern verstanden wird:

<html>
<head>
... (u.a. Definition der Javascript-Funktion zum Laden der einen oder anderen Seite, abhängig vom Browser)
</head>
</body onLoad="Aufruf der Javascript-Funktion">
<noscript>
<h1><a href="URL der Version ohne Internet-Explorer-Gimmicks">
Name des Vereins></a></h1>
<p>Über den obigen Link erreichen Sie eine Version unserer Website, die kein Javascript erfordert.</p>
</noscript>
</body>
</html>

Diese Google-Suchabfrage zeigt eines der möglichen Probleme: Bei diesen über 60.000 Seiten alleine im deutschsprachigen WWW haben die Designer in ihrer Javascript-Besoffenheit vergessen, daß zu den "Besuchern" ihrer Website auch die Spider der Suchmaschinen gehören.

3.2 Falle: Graphiken und Flash

Graphiken und Flash sehen schön aus. Sie haben aber hinsichtlich der Suchmaschinen einen Riesennachteil: In einer Graphik bzw. einer Flash-Anwendung enthaltene Texte werden nicht in den Index der Suchmaschine aufgenommen. Grundsatz: Was eine Suchmaschine finden können soll, das muß in der HTML-Datei als Text vorhanden sein..

3.3 Falle: Frames

Die Verwendung von Framesets erlaubt es zwar, mit geringem Aufwand eine Navigationsleiste (meist am linken Rand) über die verschiedenen Teile einer Website zur verfügung zu stellen. Für die Erschließung über Suchmaschinen hat die Verwendung von Framesets aber die folgenden gravierenden Nachteile:

Es ist kein Zufall, daß Websites von großen Unternehmen, die ihr Geld mit den Besuchern ihrer Seiten verdienen (Amazon, eBay, Yahoo ...) auf Frames verzichten.

Meine Ratschläge zu Frames

  1. Verzichten Sie auf Frames. Benutzen Sie im Zweifel (als einfachste von mehreren Alternativen) lieber Seiten, in denen die Navigationsleiste als Tabellenzeile bzw. -spalte angeordnet ist.
  2. Falls Sie partout nicht auf die Verwendung von Frames verzichten können: sehen Sie wenigstens einen noframes-Bereich auf der Framesetseite vor. Schreiben Sie in diesen Bereich nicht einen der von manchen Webseiteneditoren vorgehgebenen Text "Ihr Browser unterstützt keine Frames...", sondern füllen Sie diesen Bereich mit sinnvollem Inhalt (einem Inhaltsverzeichnis Ihrer Website) und sehen Sie in diesem Inhalt Links zu allen wesentlichen Unterseiten Ihrer Website vor.
  3. Verzichten Sie auf Frames. Das kann man nicht oft genug sagen.

Diese Google-Suche listet tausende von Seiten, die dem Benutzer der Suchmaschine mit der wenig hilfreichen Fehlermeldung, daß ihr Browser keine Frames beherrscht, konfrontiert. Diese Suche zeigt Websites, die die gleiche Nachricht auf Deutsch in der von der Suchmachine ausgegebenen Ergebnisseite bewirken.

Warum Frames die Suchmaschinen-Position schädigen (Klaus Schallhorn)

3.4 Sinnvoll aber auch möglicherweise eine Falle: dynamische Inhalte

Eine wichtige Verbesserung für das praktische Management von Webseiten sind sogenannte Content-Management-Systeme (CMS). In diesen sind die inhalte (Artikel etx.) nicht als statische HTML-Seiten, sondern in einer Datenbank gespeichert. Die Webseite, die der Benutzer sieht, wird zum Zeitpunkt des Aufrufs von der CMS-Software auf dem Server aus den relevanten Einträgen ind er Datenbank zusammengesetzt.

Die Vorteile sind, daß sich häufig wechselnde Inhalte mit weniger Arbeitsaufwand pflegen lassen als mit einem HTML-Editor. CMS-Systeme haben meistens Eingabemasken, die vom Bediener keinerlei HTML-Kenntnisse erfordern - ein klares Plus.

Ein Nachteil vieler datenbankbasierter Webanwendungen ist aber, daß ihre URL viele verschiedene CGI-Parameter enthält. Bis vor einigen Jahren haben Suchmaschinen vor dynamischen URLs (wie zum Beispiel http://www.beispielverein.de/vereinszeitung/artikel.cgi?nr=1255) ganz zurückgeschreckt, weil die Gefahr besteht, daß der Spider sich in einer unendlich großen Anzahl bildbarer Link-URLs verfängt.

Moderne Suchmaschinen (wie z.B. Google) wagen sich an dynamische URLs, aber wenn die CGI-Parameter zu viele und zu lang sind, lassen sie die Finger davon.

Tipps für den Fall, daß Sie Seiten haben, die dynamisch erzeugt werden und die in Suchmaschinen gefunden werden sollen:

Beispiel: Sie betreiben die Site eines Sportverbands, bei der die verschiedenen Meldungen nach Sportart, Bundesland etc. gegeliedert in einer Datenbank gespeichert sind.

Die interne URL für eine bestimmte Meldung lautet z.B.
http://www.sportverband.de/meldung.cgi?sportart=segeln&bundesland=berlin&nr=1855

Mit Hilfe von mod_rewrite können Sie diese URL nach außen z.B. im folgenden Format darstellen:
http://www.sportverband.de/segeln/berlin/1855.html

Dokumentation des Apache-Moduls mod_rewrite (apache.org)

Meine Website zum Überprüfen von ISBN auf richtige Prüfziffer verwendet ein Perl-Skript, das die zu testende ISBN und Sprache der Ausgabe als CGI-Parameter übergeben bekommt. Damit lautet die URL für das Überprüfen der ISBN 3-430-11862-X:

http://www.isbn-check.de/checkisbn.pl?isbn=3-430-11862-X&lang=de

Ich entschied mich, zur eventuellen Aufnahme bestimmter Seiten in Suchmaschinen das folgende URL-Format zu verwenden:

http://www.isbn-check.de/de-3-430-11862-X

Dies wurde mit Hilfe des folgenden Codes in der .htaccess-Datei realisiert:

<IfModule mod_rewrite.c>
RewriteEngine on
RewriteBase /
#rewrite URLs in format aa-iiiiiiiiii as checkisbn.pl?isbn=iiiiiiiiii&lang=aa
RewriteCond %{REQUEST_URI} ^/([a-z][a-z])-([0-9X-]+)$
RewriteRule ^/?([a-z][a-z])-([0-9X-]+)$ /checkisbn.pl?isbn=$2&lang=$1
</IfModule>

Im Vergleich mit anderen für diesen Zweck veröffentlichten Lösungen werden dem erfahrenen Benutzer von Apache und mod_rewrite die folgenden Besonderheiten auffallen:

3.5 Falle: nicht konstante URL für einen bestimmten Inhalt

Etwas, was häufig zu beobachten ist: Sie haben in einer Suchmaschine eine Seite gefunden und klicken auf den Link. Es öffnet sich aber nicht die erwartet, von der Suchmaschine indizierte Seite, sondern eine Seite mit der Fehlermeldung, daß die Seite nicht mehr auf dem Server vorhanden ist.

In manchen Fällen gibt es den gesuchten Text tatsächlich nicht mehr auf dem Webserver. Oft existiert die Seite aber noch, sie wurde nur umbenannt oder auf dem Server verschoben.

Beispielsweise habe ich beobachtet, daß manche Firmen die englischsprachige Eingangsseite Ihrer Webpräsenz nach dem folgenden Muster umbenannt und verschoben haben:

Zuerst http://www.beispiel.de/index_uk.htm
Dann http://www.beispiel.de/index_en.htm
Später http://www.beispiel.de/index_en.html
Schließlich http://www.beispiel.de/english/

Typischerweise werden von der alten URL zur neuen URL nicht einmal Weiterleitungen (redirects) eingerichtet. Webnutzer, die die Seite unter der alten URL auf einer anderen Website oder in einer Suchmaschine finden, gelangen dann nicht auf die gewünschte Seite. Der Website entgehen Besucher. Webmaster, die solche URL-Änderungen ohne Sinn und Verstand vornehmen und nicht einmal Weiterleitungen (redirects) einrichten, verdienen Prügel.

Umbenennungen von Dateien und alles andere, was zur Änderung der URL einer Seite führt, sollte deshalb tunlichst unterlassen werden.

Cool URIs don't change (von der Site des W3C)

Es gibt Fälle, in denen eine Verschiebung einer Seite auf eine neue Seite nicht zu vermeiden ist. Zum Beispiel kann sich der Name Ihres Unternehmens/Ihres Vereins geändert haben (neuer Domainname) oder aber die Namensgebung/ die Ordnerstruktur auf Ihrer Website haben sich als derart verkorkst herausgestellt, daß eine Neuordnung unvermeidlich ist. In solchen Fällen sollten Sie unbedingt Weiterleitungen (redirects) einrichten, damit sowohl Benutzer als auch Suchmaschinen-Spider die Seiten am neuen Ort finden

Beispiel 1: Ihre Kreditvermittlung Kredithai GmbH (www.kredithai.info) hat aus Marketinggründen umfirmiert in Kredithilfe GmbH und will deshalb ihre Website künftig unter www.kredithilfe.info veröffentlichen.

Damit die Besucher, die über Links auf die alte Domain kommen, und die Linkpopularität der bisherigen Links erhalten bleiben, behalten Sie die alte Domain www.kredithai.info und ersetzen den bisherigen Inhalt durch eine Datei .htaccess mit der einzigen Zeile

Redirect permanent / http://www.kredithilfe.info/

Damit werden alle Abrufen von URLs von der alten auf die neue URL umgelenkt, auch von Unter-URLs. Zum Beispiel wird mit dieser Lösung auch http://www.kredithai.info/seite2.html nach http://www.kredithilfe.info/seite2.html weitergeleitet.

(Anmerkung: Diese Lösung setzt voraus, daß Sie als Webserver Apache verwenden.)

Beispiel 2: Sie betreiben die Website www.beispiel.de, bei der die URL der englischsprachigen Eingangsseite bisher http://www.beispiel.de/index_uk.htm war. Weil die bisherige URL-Struktur so desorganisiert ist, daß ein Aufräumen unumgänglich war, haben sie die Seiten umorganisieren müssen, so daß die URL jetzt http://www.beispiel.de/english/ ist.

Aus den oben genannten Gründen wollen sie die negativen Folgen der Änderung durch das Einrichten einer Weiterleitung abmildern. Dazu fügen Sie der Datei .htaccess der Website die folgende Zeile hinzu:

Redirect permanent /index_uk.htm http://www.beispiel.de/english/

(Anmerkung: Diese Lösung setzt voraus, daß Sie als Webserver Apache verwenden.)

Dokumentation des Moduls mod_alias (des Apache-Webservers).

3.6 Machen Sie es anderen leicht, auf Seiten in Ihrer Website zu linken

Wer Links von seiner eigenen Site auf Ihre Site setzt, tut Ihnen einen Gefallen, weil er Ihrer Site Besucher bringt und die Bewertung Ihrer Site in Suchmaschinen verbessert.

Es versteht sich deshalb eigentlich von selbst, daß Sie es Leuten, die einen Link setzen wollen, so leicht wie möglich machen.

Ein Aspekt, der dabei leider oft übersehen wird: Für viele Zwecke ist ein Link auf die Eingangsseite Ihrer Website nicht sinnvoll, weil der Link auf einen Inhalt zeigen soll, der nur einen kleinen Aspekt Ihrer Site ausmacht. Beispielsweise ist auf Ihrer Site eine besonders gute Definition eines Begriffs, oder eine gute Kartenskizze Ihres Ortes zu finden. Solche Links werden auch als deeplinks bezeichnet.

Hier zahlt es sich aus, wen Sie Ihre Seiten so gestalten, daß jemand anders einen Link genau auf einen bestimmten Inhalt - eine bestimmte Seite oder auch einen Teil der Seite - setzen können. Der HTML-Tag <a name="...."> </a> eignet sich gut dazu, Linkziele im Inneren einer Seite anzubieten.

Beispielsweise ist eine andere Seite von mir zu Erfahrungen zu einigen Häfen in Spanien hinsichtlich ihrer Eignung als Stopp bei Segeltörns mit dem o.g. HTML-Tag so gestaltet, daß die URL

          http://tomas.schild.net/segeln/haefen-spanien-balearen-andalusien-gibraltar.html#formentera#formentera

direkt auf den Abschnitt der Seite zum Hafen auf Formentera zeigt, so daß jeder einen Link direkt auf diesen Abschnitt setzen kann.

Es versteht sich von selbst, daß zum Erleichtern von Links aus anderen Sites gehört, daß sich die URL für einen bestimmten Inhalt nicht ändert.

Besonders schädlich für die Verlinkungsfreundlichkeit Ihrer Site ist die Benutzung von Frames, weil ein Link auf die Seite zu einem bestimmten Thema im Frameset oft dann auf eine Seite ohne den Navigationskontext führt, und andererseits ein Link auf das gesamte Frameset nicht speziell auf das Thema der speziellen Seite führt.

3.7 Nicht zu empfehlen: proprietäre Dateiformate wie Winword oder PowerPoint

3.8 Schädlich: Inhaltsarme Eingangsseiten (splash screens)

Ihre Hauptseite bekommt (da sie die einfachste URL hat) die meisten eingehenden Links. Wenn sie nur wenig suchbaren Inhalt hat, sind diese Links für Ihre Suchmaschinenpopularität verschwendet.

Noch schlimmer: Auf vielen Seiten sieht man splash screens, bei denen der nicht eingeweihte Besucher nicht sehen kann wie er zum Rest der Site vorankommt. Der Link zur "eigentlichen"e; Site ist hinter einer Graphik oder einem text versteckt. Der Siteautor weiß natürlich, wie der Sitebesucher sich weiterklicken sollte - der letztere weiß es aber nicht, sucht nach einem Link zum inhalt der Site, findet ihn nicht und wendet sich frustriert ab.

3.9 Kein Allheilmittel, aber auch nicht zu vernachlässigen: Metatags.

Meta-Angaben zum Inhalt (SELFHTML)
Die wichtigsten Metatags: Beschreibung, Autor, Stichwörter, Datum (SELFHTML)
Metatag-Generator (sitesubmission.de)

3.10 Unerlässlich: der <title>-Tag

3.11 Nicht vergessen: Links zur Homepage von allen Seiten.

Jede Seite Ihrer Site sollte einen Link zur Homepage der Site haben.

3.12 Hilfreich auch für Sie: barrierefreies Webdesign

Barrierefreies Webdesign und Einfach für alle sind Sites mit Artikeln zum Thema..
Bobby ist eine Online-Überürüfungsmöglichkeit
Die dazugehörigen Richtlinien des W3C: auf deutsch und englisch

3.13 Auswahl des Webhosters

Bei welchem Webhosting-Unternehmen Sie Ihre Website ins Web stellen, wirkt sich nicht nur auf Ihren Geldbeutel, sondern auch auf die Suchmaschinenfreundlichkeit der Seite aus. Sie haben die folgenden Möglichkeiten:

  1. die billigste: Sie nutzen einen kostenlosen Webhoster wie zum Beispiel Geocities. (Verzeichnis kostenloser Hostingangebot (www.freewebspace.net))
    Das hat eine Reihe von Risiken:
  2. Die zweite Möglichkeit: Sie nutzen den von Ihrem Internet-Provider (zum Beispiel T-Online) für Ihr Benutzerkonto angebotenen Webspace.
    Die Qualität ist in der Regel zuverlässiger (Sie sind ja zahlender Kunde); der wesentliche Nachteil ist, daß Sie Änderungen der Geschäftspolitik hinsichtlich des Webspaces für Kunden und desssen URL ausgeliefert sind. Ein Beispiel dafür ist, daß noch im Jahre 2003 >die bisherigen Homepagedas bisherige Webspace-Angebot von T-Online unter den URLs http://home.t-online.de/home/<name> oder http://<name>.bei.t-online.de eingestellt werden und die Nutzer entweder Site unter der neuen Adresse http://<name>.privat.t-online.de einrichten oder sich nach Webspace bei einem anderen Anbieter umsehen müssen.
  3. Sogenannte Vanity-URLs, die von Anbietern wie cjb.net angeboten werden. Die Funktion solcher Dienste ist es, daß Besucher eine von Ihnen gewählten Subdomain des Anbieters (z.B. beispiel.de.vu in ihren Browser eingeben sollen, und der Weiterleitungsdienst auf die tatsächlich auf die tatsächlich verwandte URL (meist in kostenlosem Webspace, s.o.) weiterleitet. Die Weiterleitung erfolgt über HTTP-Redirect oder indem Ihre eigentliche Website in einem Frame unter der Vanity-URL eingerahmt wird.
    Nachteile solcher Weiterleitungsdienste sind:
  4. Als letzte Möglichkeit sei die beste und professionellste genannt: Das Anmieten von Webspace unter Ihrer eigenen Domain bei einem Webhoster. Dies ist für alle nur im mindesten ambitionierte Webprojekte die einzig annehmbare Lösung.

Eine sehr informative unabhängige Site zum Thema ist die Webhostlist. Sie enthält eine Datenbankder verschiedenen Angebote und ihrer Preise und, wichtig, die Bewertung der Unternehmen durch andere Kunden.

Persönlich kann der Autor dieser Site den Anbieter Domainfactory empfehlen; dieser Webhoster ist günstig aber nicht der allerbilligste und nach bisheriger Erfahrung (Juni 2002-Oktober 2007) zuverlässig und mit einem guten Featureumfang.

3.14 Klare Entscheidung nötig: URL mit oder ohne Subdomain 'www.'?

Seite zuletzt geändert 2007-01-30 durch Tomas Schild

Home