Práctica 3: ¿Qué es Google?

Los buscadores se han convertido en un aspecto fundamental de nuestras vidas. Abres el navegador web y lo primero que aparece es Google. ¿Qué quieres saber? Tecleas las primeras letras y pulsas en buscar. En menos de un segundo tienes 10 posibles respuestas a tu consulta. 

¡Es genial! 

Pero… ¿cómo lo hace?

1. Rastrea los millones de páginas accesibles en la Red

Rastrear la Red es una tarea monstruosa, por esa razón Google no la hace “personalmente”. En su lugar, se sirve de unos programillas llamados robots, a los que envía a recolectar páginas.
Cuando un robot llega a una página web, lo que hace es leerla y recoger ciertas secciones que luego almacenará en su índice. Después, sigue los enlaces contenidos en la página y continúa haciendo lo mismo en otras páginas.



El proceso se parece al de una colmena que envía a sus abejas a recolectar polen de flor en flor. Google es la colmena, los robots son las abejas y cada flor es una página web. El polen son los contenidos que empleará el buscador para clasificar la Web mediante su receta secreta.




2. Almacena las páginas en su índice

De nada sirve tanto esfuerzo si la información recolectada no se almacena en ninguna parte. Así que, una vez que el robot ha recogido el contenido de una página, su siguiente tarea es almacenarlo en sus enormes bases de datos.
Este proceso se llama indexación, y su propósito es guardar toda la información que Google necesitará en el momento en que alguien realice una búsqueda.


3. Ofrece una lista ordenada de páginas

Para la mayoría de nosotros, la búsqueda del conocimiento comienza con una consulta de búsqueda. El siguiente paso ocurre cuando el buscador devuelve una lista de páginas clasificadas con la intención de satisfacer nuestra petición.
Para llevar a cabo esta tarea, Google hace 2 cosas:
  1. Selecciona las páginas que están relacionadas con las palabras introducidas.
  2. Ordena las páginas una detrás de otra según su propio criterio.
Es así de sencillo.
Google no hace magia, en realidad sigue un proceso lógico para descubrir y ordenar la Web.