Was wäre das Internet ohne Suchmaschinen? Wie viele Male nutzt du eine Suchmaschine wenn du am Computer sitzt? Wie kommen die Daten in die Suchmaschine?
Inhaltsverzeichnis
Was für Suchmaschinen gibt es?
Die größte und bekannteste Suchmaschine ist Google. Die Google Suchmaschine hat es geschafft, zur Nummer 1 im Suchmaschinen Geschäft zu werden.
Viele Leute sagen bereits „Ich Google“ wenn sie etwas mit einer Suchmaschine im Internet suchen.
Andere mehr oder weniger bekannte Suchmaschinen sind Bing, Yahoo, Fireball, Altavista, HotBot, Infoseek, Metager und die Kindersuchmaschine Blinde Kuh.
Dann gibt’s auch noch die spezialisierten Suchdienste für Videos, Musik, etc.
Wie kommen die Daten in die Search Engine (Suchmaschine)?
Du musst dir eine Suchmaschine wie einen großen Katalog vorstellen, in dem alle Websites der Welt gespeichert sind.
Eine SUMA ist ein gigantischer Web-Katalog, in dem alles zu den Homepages aufgelistet ist, was in der Homepage veröffentlicht wird und wurde.
Wie ist dieser Webkatalog aufgebaut?
Eine SUMA ist ein gigantischer Computer, der nur für die Internetsuche und Katalogisierung (Indexierung) des Internets betrieben wird.
Allerdings sind das keine kleinen Computer, denn um die riesige Menge an Daten zu speichern, welche im Internet vorhanden sind, braucht es riesige Datencenter.
Wie du im Video sehen kannst, sind die Datacenters große Hallen, in denen Container stehen, welche mit Computer gefüllt sind.
Google betreibt mehrere solche Datencenter auf der ganzen Welt und es wird geschätzt, dass in diesen Daten Zentren einige hunderttausend Computer betrieben werden.
Die Computer sind speziell angefertigte PC’s, welche in Racks untergebracht werden, wie es in vielen Rechenzentren gemacht wird.
Die Daten sind mehrfach in diesem großen Computerverbund gespeichert. So funktioniert die Suchmaschinen auch noch zuverlässig, wenn ein Computer Zentrum ausfällt.
Wie findet die Suchmaschine die Daten im Internet?
Die SUMA hat viele Suchagenten (Suchroboter, Search Bots, Webspider, Spider, Webcrawler) die im Internet unterwegs sind.
Diese Webcrawler werden parallel von verschiedenen Datenzentren durch das Internet geschickt
Die Suchagenten sind kleine Computerprogramme, welche in mehr oder weniger regelmäßigen Abständen die Websites durchsucht.
Bei einer neuen Homepage wird zuerst einmal alles aufgenommen.
Dann schaut die SUMA später wieder vorbei und schaut, ob es etwas Neues gegeben hat.
Je öfters neuer Content ( Inhalt / Artikel / Videos / Bilder ) publiziert wird, um so kürzer sind die Intervalle, in denen der Suchagent vorbei schaut, ob es etwas Neues gegeben hat.
Wie werden die Daten verarbeitet?
Das ist nun das große Geheimnis jeder Suchmaschine. Der so genannte Such-Algorythmus wird wie der Augenapfel gehütet und ist das große Geheimnis der Suchmaschinen Betreiber.
Denn die schier endlose Masse an Daten, welche die Suchagenten dauernd anliefern, muss ja so verarbeitet werden, dass später sinnvolle Ergebnisse zustande kommen, wenn du eine Suchanfrage machst.
Mit dem Suchalgorythmus werden die Daten so indexiert, dass ein möglichst relevantes und genaues Suchergebnis auf deinem Computer Bildschirm angezeigt wird.
Wenn du im Suchschlitz auf deinem Computer eine Eingabe machst, dann nutzt du im Hintergrund eine große technische Infrastruktur und eine hoch komplizierte Software.
Wie funktioniert ein Suchabfrage?
Wenn du nach einem bestimmten Wort oder Ereignis suchst, dann gibst du ein oder mehrere Suchwörter im Suchschlitz ein und sendest die Such-Anfrage ab.
Dann beginnt die Arbeit der Suchmaschine.
Weil die SUMA die Dokumente intelligent indexiert hat, muss sie nicht alle Dokumente immer wieder neu durchsuchen und kann so innerhalb von Sekunden die Suchergebnisse auf deinem Computer Bildschirm zurücksenden.
Die Suchergebnisse werden in einer bestimmten Reihenfolge präsentiert.
Die Reihenfolge beruht darauf, wie hoch die Suchmaschine die Relevanz des Dokuments einschätzt.
Die Relevanz wird von jeder Suchmaschine auf verschiedene Art und Weise ermittelt. Dabei spielen verschiedene Faktoren eine Rolle.
Einige Faktoren sind:
- Anzahl der gesuchten Wörter im Dokument
- Wie relevant ist die ganze Website zu dem gesuchten Keyword
- Wie viele andere Websites verlinken auf dieses Dokument