FAZ Nr.19 23.Januar 2001
Roboter zum Nulltarif

Suchmaschinen für die eigene Internet-Seite / Gute Technik steht kostenlos bereit

Was man nicht alles elektronisch geschenkt bekommt! An Software, die kostenlos aus den Weiten des Webs zu uns kommt, hat man sich bereits gewöhnt. Nun werden uns noch selbstherumlaufende Roboter geboten, gelegentlich Krabbler (crawler) oder Spinnen (spider) genannt, die ihren Dienst direkt bei unstun oder – speziell für uns –  in ihrem fernen Serverhäuschen. Gekrabbelt wird im Internet, seit sich Louis Monier die Suchmaschinen ausgedacht hat und Mike Burrows die Indizierung für Altavista programmierte. Beim Krabbeln verfolgt ein Rechner unermüdlich alle Links, die er nur finden kann; und eine Indizierung ist das Herumdrehen eines Textes vom gewohnten Ablauf Wort für Wort zu einer Wörterliste, in der steht, wo jedes Wort vorkommt, sagen wir „alles“ auf Platz 4, „die“ auf Platz 10 und 39. So entstehen lange Wörterlisten mit Internet-Quellenangabe. Daß man dann damit selbst so exotische Tiere wie „Staunzen“ sekundenschnell im ganzen Internet findet, noch dazu kostenlos, ist eines der großen Wunder der Technik.

Geschickte Wort-Inventur

Nun möchte man als WWW-Seitenbesitzer seinen geschätzten Besuchern die Möglichkeit geben, dort und nur dort einen bestimmten Begriff zu suchen und zu finden. Warum die weite Welt absuchen, wenn man doch weiß, das Gute liegt so nah? Ein Beispiel: Wo genau stand das mit dem „Altwasser“ bei Britting.com? Wir wurden also mit dem Wunsch herausgefordert, eine private Suchmaschine für alle Internet-Seiten einer bestimmten Domäne (oder generell eines Auftritts) ins Leben zu rufen. Dafürgibt es zwei Möglichkeiten. Die erste bedingt tatsächlich ein kleinesProgramm auf dem Server, der dann die zu indizierenden Dateien enthält. Dazu kommt eventuell noch ein Stück Java-Script als ein eingebettetes Programm in den übermittelten Internet-Seitenstrom, das den betrachtenden Browser zur Suche in den zuvor präparierten Tabellen veranlaßt. Wir fanden dazu einige Muster im Web, entschieden uns dann aber glücklicherweise dagegen, zumal der Server und sein Chef mitspielen müssen, denn die invertierte Datei mit den Indizes steht in diesem Fall dort. Es lohnt sich vielleicht, beim Betreiber des Servers nachzufragen, ob er nicht ohnehin eine Suchmaschine auf seinem Host betreibt.
   Viel eleganter sind externe Krabbler, die – bei kleinen Sites bis zu 500 Seiten kostenlos oder nur gegen ein bißchen Werbung – ganz speziell und eigens die gewünschte Domäne durchforschen. Beim bekanntesten davon, Atomz.com, kann man den Fortschritt sogar mitverfolgen. Zum Abschluß erhält man ein Protokoll der „Hausdurchsuchung“, zusätzlich eine Liste loser Links und eine Übersicht über die Baumstruktur seiner Site, eine sogenannte Sitemap. Die Ergebnisse der Krabbelei werden alsdann im Nest des Dienstleisters bewahrt; man selbst spart sich den Speicherplatz dafür. Bei Atomz sind die Indizes unter einer Kontonummer des Antragstellers abgeheftet. Mit seinem Paßwort kann man sogar die Ausgabemaske ändern – in unserem Fall eindeutschen – und vor allem neue Indizierungsläufe auslösen, wenn man soviel wichtiges Neues auf die Site gestellt hat, daß sich eine neue Wort-Inventur lohnt. Sonst läßt sich das Indizieren periodisch terminieren.
   Wie aber erhält der Suchende die Suchergebnisse? Hier der Trick: Der Webseiten-Ersteller muß in die Seite mit dem Suchfeld den vorgegebenen HTML Kode einfügen, der innerhalb einer Form-Anweisung ein Texteingabefeld für das zu suchende Wort und einen Auslöseknopf vorsieht. Drückt der Suchende dann auf diesen Knopf, wird nahtlos an die Suchmaschine weitergegeben: so, als ob man auf einen Link dorthin geklickt hätte. Zugleich wird der Suchmaschine das zu suchende Wort und die Kundennummer durchgereicht, auf daß das Wort auch in der richtigen Site gefunden wird und nichtanderswo. Der Mechanismus ist einfach und ausbaufähig, wenn etwa die Reihenfolge der gefundenen Einträge vorbestimmt werden soll. Zunächst verzichten die meisten auf Feinheiten und setzen sie erst in einem späteren Schritt ein, dann, wenn der Suchende mit der Ergebnismaske der Suchmaschine konfrontiert ist, die dann weitere, feinere Suchvorgänge erlaubt – und zuweilen, wie beim Konkurrenten Freefind.com – ein wenig Werbung mit einblendet. Eingerichtet ist das Ganze in einer halben Stunde. Wer will, kann sich dieAnzeige des Suchergebnisses umgestalten oder Suchoptionen einstellen: etwa,daß PDF-Dateien, ja sogar wirbelige Macromedia-Auftritte mit durchsucht werden sollen, von denen öffentliche Internet-Suchmaschinen sonst oft nichts wissen wollen. Die Suche kann auf deutsche Umlaute und Mehrzahlbildungen eingestellt werden – nur das Forschen nach ähnlich getippten Wörtern schaltet man besser ab. Es lassen sich Synonyme eingeben wie Fön fürFöhn, so man solcherlei anbietet. Wöchentlich bekommt man einen Bericht, nach was die Besucher gesucht haben; das ist aufschlußreich. Ein trickreicher Web-Meister hat die Atomz-Suchmaske sogar in seine Fehlanzeige-Seite eingebaut, damit man bei losen oder vertippten Links gleich inhaltlich nachfragen kann. Wer will, kann das Atomz-Logo ganz ausblenden – wir fänden das bei diesem kostenlosen Dienst aber unfair.

Kostenlos, wie vieles im Internet

Atomz ist ein typischer neuer „Application Service Provider“, einer, der gleich die ganze Arbeit macht, statt einem nur die Software zuzuschicken. Kaum im Juli 1999 von zwei Macromedia-Abspringern mit vier Millionen Dollar gegründet, hat das Unternehmen schon 35 000 aktive Nutzer in über hundert Ländern und bedient monatlich fast 20 000 Anfragen. Dabei ist der „Laden“ mit 33 Mitarbeitern klitzeklein. Das hiesige Erstaunen über den Sucherfolg war ungeheuer. Nicht nur die literarische Hilfe, die Wortsuche für Studienzwecke bringt, sondern ganz praktisch: „Wie schnell kann man ein Gedicht finden, wenn man nur Teile (oder ein Wort, etwa ‚Passau‘) kennt? Eingeben und Link anklicken, simsalabim: schon ist es da!“ – so der Archivar des Dichters. Was uns verwöhnte Techniker noch mehr erstaunt, das ist die Offenheit, die Kostenlosigkeit dieses Dienstes. Das sei allen strammen Service-Providern hierzulande ins Stammbuch geschrieben: „Sei großzügig bei Kleinen und Kleinem, dann machst du das große Geschäft mit den Großen...“ Denn eine Suchmaschine ist ein Muß für professionelle Firmenauftritte, in denen man sonst vergeblich nach einem Detail wie der Adresse sucht. Atomz sucht inzwischen für Price Waterhouse Coopers, für A1 Gore und Hewlett-Packard-Entwickler.

         FRITZ JÖRN
FAZ Nr.19 vom 23.Januar 2001, siehe auch „Zeitloses Internet“