02. Mai 2008 |
|
Google gehört wohl zu den bekanntesten Suchmaschinen. Zumindest wenn man Schüler zur Recherche ins Internet schickt, kann man davon ausgehen, dass diese Suchmaschine bei fast allen als bekannt voraus gesetzt werden kann; aber das war es auch schon. Das mehr oder weniger geschickte kombinieren adäquater Suchbegriffe führt bei der einen und anderen Gruppe zu akzeptablen Ergebnissen. Ein Blick auf die "Erweiterte Suche", mit der es möglich ist, durch eine kluge Auswahl der einzustellenden Parameter auf dieser Seite, die Anzahl der unbrauchbaren Fundstellen zu reduzieren und damit das Recherche-Ergebnis zu verbessern, ist dann schon eher die Ausnahme.
Werfen wir nun einen Blick unter die Motorhaube von Google und verschaffen uns einen kurzen Einblick in die unerschöpflichen Suchmöglichkeiten, die oft nur Insidern bekannt sind, und thematisch in den Bereich "Google Hacks" gehören. Ein entsprechendes Tool mit gleichem Namen "GoogleHacks" wird sogar von code.google.com angeboten, mit fogendem Hinweis:
Gehen wir von folgendem Szenario aus: Sie suchen nach Dateien bestimmten Typs, etwa Audio- oder Videodateien, die Sie online anschauen wollen. Die Eingabe des Datenamen "abc.mp3" als Suchbegriff bringt Sie nicht weiter, da zwar Webseiten aufgelistet werden, in denen diese Datei erwähnt wird, ohne dass Sie zu dieser Datei geführt werden. Bei normalen Web-Seiten kann eine Suchmaschine wie Google nicht unterscheiden, ob eine Datei nur erwähnt wird oder ob tatsächlich ein Link zur Datei vorhanden ist. Bekomme ich aber ein Directory-Listing des Webservers, ist der auf einer Web-Seite verlinkte Text zuverlässig ein Dateiname. Also: wenn eine Webadresse (URL) keine HTML-Datei anzeigt, sondern eine Auflistung der Dateien eines bestimmten Server-Verzeichnis, dann können Sie mit dieser Webseite auf die aufgelisteten Dateien zugreifen. Solche Auflistungen sind immer mit „Index of“ überschrieben. Dies können Sie nutzen, um gezielt Directory-Listings mit Dateien zu suchen. Dazu erweitern Sie den Google-Such-String ein wenig: Je mehr Sie ausschließen, desto sicherer liefern die verbleibenden Treffer wirklich Dateien. Zwar ist dieses Verfahren auch nicht hunderprozentig sicher, aber Sie müssen sich wenigstens nicht minutenlang durch nutzlose Suchergebnisse klicken. Der Trick besteht darin, HTML-Dateien mit „-inurl“ auszuschließen und das wichtige„Index of“ aus dem Seitentitel explizit in die Suche aufzunehmen. Danach geben Sie den Dateityp und den Suchbegriff an. Die Google-Suche
-inurl:htm -inurl:html -inurl:php intitle:"index of" mp3 suchbegriff
liefert also MP3-Dateien zum jeweiligen Suchbegriff. Googlehacks gibt es viele, und selbst in den seriösen Medien kommt das Thema immer wieder vor. Googlehacks können aber auch kurios sein, so z. B. “robots.txt” + “Disallow:” filetype:txt Ein origineller Link findet sich hier auf Platz 1 - die robots.txt vom Weißen Haus, in der von den Administratoren festgelegt wird, welche Webverzeichnisse für Google unsichtbar sein sollen, also nicht gescannt werden sollen. weiterführende Literatur:
Google Hacks
Tips & Tools for Finding and Using the World's Information Rael Dornfest, Paul Bausch & Tara Calishain Third Edition August 2006 ISBN 978-0-596-52706-8 Seiten 543, broschiert EUR24.00, SFR39.90
|
|
| Zuletzt aktualisiert am Freitag, den 02. Mai 2008 um 16:08 Uhr |









