Um in den Ergebnislisten von Suchmaschinen mit aufgelistet zu werden muss eine Webseite zunächst bei der entsprechenden Suchmaschine angemeldet und in deren Index aufgenommen werden. Dieser Vorgang wird als indizieren bezeichnet. Eine aufgenommene Webseite ist damit eine indizierte Webseite. Die Indexe der Suchmaschinen werden automatisch in regelmäßigen Abständen überarbeitet und aktualisiert. Bei Google erfolgt diese Aktualisierung monatlich.
Auch vor der Indexierung kann eine Webseite schon in den Suchergebnissen einer Suchmaschine auftauchen. Durch den Fresh Crawl, der täglich durchgeführt wird und bei dem ein Robot das Web nach neuen Webseiten durchforstet, werden neue Seiten zunächst oberflächlich erfasst und aufgenommen. Erst nach dem Deep Crawl und dem nächsten Google Dance (Aktualisierung des Index) wird die neue Seite dann indiziert. Sie wird in das Index aufgenommen und durch ein reales Ranking System mit einem PageRank versehen. Aufgenommen werden dabei nur Webseiten, die den Suchmaschinenregeln entsprechen. Neue Webseiten die gegen diese Regeln verstoßen werden nicht indexiert und aus dem Datenbestand wieder entfernt.