Búsquedas en Internet: ¿Cómo funciona Google?

Guía básica de cómo hace Google para darte lo que buscas en Internet

Cómo funcionan las búsquedas
Martin Kovensky / Getty Images

Todos los días se hacen búsquedas en Internet y desde inicios del siglo XXI Google es la herramienta preferida de los cibernautas para encontrar prácticamente cualquier cosa.

Quizá alguna vez te hayas preguntado qué pasa detrás de bambalinas, entre el momento que presionas “enter” en tu teclado y te aparece una lista de opciones (usualmente es una cuestión de fracciones de segundo). Las listas que se te presentan como resultados usualmente incluyen mucho más contenido del que hubieras creído, incluyendo ligeras correcciones en tu ortografía o sugerencias de lo que quizá quisiste decir.

  Por ejemplo, para una búsqueda sencilla, como “Internet básico”, Google te da una respuesta en aproximadamente 0.27 segundos, con más de 34 millones de resultados (sí, millones).

¿Cómo es que ocurre esta magia? ¿Qué es lo que permite que se tengan tantos resultados, y con tantas combinaciones de esas dos palabras?

A grandes rasgos, sin entrar en detalles técnicos, Google explica cómo ocurren las búsquedas haciendo referencia a tres pasos básicos:

1. Rastreo e indexación (crawling and indexing)

Detrás de bambalinas, Google tiene herramientas que le permite navegar continuamente en Internet, haciendo lo que se llama el rastreo (crawling), que básicamente es seguir enlaces de una página a otra. Google entonces ordena a las páginas que va encontrando en base a su contenido y otros elementos, para después organizarla y almacenarla en un índice (el índice), que, de acuerdo a datos publicados por Google, llega a tener un tamaño de más de 100 millones de gigabytes (puedes ver cuánto es esto en esta página de resultados de Wolfram-Alpha).

2. Algoritmos

Google desarrolla programas y fórmulas que hacen posible entregarte resultados relevantes a lo que buscas. Cuando haces una búsqueda, se ponen en marcha diversos algoritmos con el fin de interpretar qué es exactamente lo que estás buscando. Dichos algoritmos son continuamente revisados y mejorados e incluyen cosas como métodos de búsqueda, autocompletado, interpretación de la consulta, uso de sinónimos, ortografía, entre otros.

Basándose en los resultados que los estos algoritmos arrojan, se utiliza el índice para obtener documentos que se consideran relevantes para tu consulta.

Dichos resultados aún no son los que se te presentan como resultado final. El siguiente paso es que los resultados parciales se pasan por un proceso de clasificación, el cual considera cerca de doscientos factores diferentes, como por ejemplo, edad de las publicaciones, contexto y filtro de safe search. Después del proceso de clasificación, los resultados finales están listos para serte presentados.

3. Eliminar SPAM

Google hace un esfuerzo importante por eliminar spam de los resultados que te brinda y lleva a cabo un proceso de revisión de documentos, que se hace tanto de forma automática como manual. De entre los tipos de spam que se filtran, están: textos ocultos o uso excesivo de palabras clave (keywords), enlaces engañosos o manipuladores (no llevan a donde dicen que te llevan), páginas con contenido o enlaces a spam, redirección de páginas, contenido sin fondo real o sin valor y dominios sin usar, entre otros criterios. Google le manda un aviso a los propietarios de las páginas que son identificadas como spam, para así permitirles hacer cambios y que sus páginas sean candidatas a ser integradas en resultados de búsquedas que se hagan en el futuro.

Si te interesa saber más sobre cómo funcionan las búsquedas de Google, puedes visitar esta página, parte de “Dentro de Google”, donde se explica cada etapa en detalle.