¿Qué es un error de cobertura de índice? Resp

Una respuesta completa requiere revisar los puntos de esta tabla de contenidos:

  1. ¿Qué es el índice de Google?
  2. ¿Qué es un error de cobertura del índice?
  3. ¿Cuáles son las consecuencias de estos errores?
  4. ¿Cómo solucionar estos errores?

¿Qué es el índice de Google? Definición del índice de Google, comparando sus contenidos con una biblioteca tradicional

Definición del índice de Google, comparando sus contenidos con una biblioteca tradicional

¿Qué es el índice de Google?

El índice de Google es comparable a una gran biblioteca, donde todas las estanterías han sido recorridas para descubrir, catalogar y colocar los libros, habiendo sido todos estos libros leídos y analizados para entender sobre qué temas tratan. Habiendo leído todos estos hipotéticos libros, Google habrá podido observar relaciones entre ellos: copias y reediciones serán poco consideradas frente al original, todo lo contrario que si se descubre que muchos libros de un tema concreto mencionan o se basan en un mismo libro concreto: entonces el "valor" de ese libro se supone muy alto.

Pasando al plano digital, el índice de Google es el conjunto de URLs (páginas) que Google ha rastreado por toda la WWW, una vez que toda esa enorme cantidad de información se consolida y se cataloga para posteriores usos que parten de este índice, de esta biblioteca de Google.

La consolidación de la información recogida es un proceso muy amplio que incluye entre otros subprocesos el análisis de las relaciones que se establecen (principalmente por enlaces) entre los diferentes dominios que componen la WWW. No solamente eso, también importa la relación interna de las páginas que componen el "corpus" (conjunto de documentos o páginas) de un dominio concreto.

La catalogación de todas esas URLs o páginas recogidas es el ordenamiento que Google hace de todos esos contenidos: los trocea en fragmentos de significado preciso y ejecuta un número indeterminado de algoritmos para fijar el valor de un contenido como respuesta más adecuada a una consulta de búsqueda.

De hecho el nombre técnico en SEO para la catalogación es indexación, esto ya señala directamente a un índice: el índice de Google.

Una vez Google ya ha completado todos estos procesos internos, ya dispone de un índice completo de tu sitio web.

¿Para qué quiere Google un índice de mis contenidos?

Imagina que tienes 1 hora libre y vas a unos grandes almacenes sin saber lo que allí se vende, pueden darse 2 situaciones:

  • Que vayas a ciegas y tengas que recorrer la mayor parte del local, probablemente sin conseguir tus compras.
  • Que dispongas de un catálogo que te informe de todos los productos disponibles así como su localización en el local.

¿Cómo crees que sacarás mayor rendimiento a tus esfuerzos? Por supuesto disponer de un catálogo (que no deja de ser algo así como un mapa especializado) te permite llegar a todos tus objetivos relevantes con el mínimo gasto de recursos

Mínimo esfuerzo y máximo rendimiento.

Los procesos de Google Search no son distintos, en el sentido de que tienen una misión que cumplir y unos recursos limitados asignados a esa misión.

Justo aquí, que hablamos de recursos, entra en juego el término crawl budget, que significa recursos de rastreo asignados.
Ten por seguro que disponer de un crawl budget decente es básico para la base de toda tu estrategia SEO.

Estos recursos de rastreo los pone Google, por lo que si se lo pones fácil serán generosos, si pones trabas (consciente o inconscientemente) tendrás problemas.

Recuerda que una de las metas de Google es "entregar la información más relevante y útil para responder a una consulta de búsqueda concreta, de la forma más cómoda y rápida que sea posible".

Por eso Google necesita crear un índice, porque así puede ordenar todo lo que tiene acumulado y utilizarlo donde y cuando lo necesite de la forma más eficiente y útil que sea posible.

¿Qué es un error de cobertura del índice?

Ahora que ya tenemos claro qué es el índice y cuál es su función, vamos a centrarnos en su cobertura.

Cobertura de Indice en Google Search Console

Captura del informe de errores en la cobertura de índice de la Consola de Búsqueda de Google

¿Qué es la cobertura del índice?

La cobertura del índice es la capacidad de Google para:

  • Rastrear y evaluar nuevas páginas que deban ser incorporadas al índice. Puede referirse al índice de tu dominio o a la totalidad del índice de Google.
  • Re-rastrear aquellas páginas que ya habían sido previamente descubiertas e indexadas, que merezcan una re-evaluación en función de posibles cambios que presenten respecto a la copia almacenada en el índice previo de Google, que deberá ser refrescado.

Dar cobertura al índice es la actividad principal de Google junto a la descubierta (que viene del importante concepto discoverability). También existe una actividad poco visible pero intensa que se conoce como Indexación Semántica Latente (del Inglés Latent Semantic Indexing o LSI), pero eso ya es liarse de verdad...

Por todo ello Google invierte grandes sumas en nuevas infraestructuras, para aumentar su capacidad de computación y almacenaje, también para incrementar su presencia en los principales puntos de intercambio de la WWW (los nodos de Internet, grandes centros donde convergen las redes telemáticas de distintos operadores en forma de pasillos y pasillos de servidores y maquinaria TCP/IP, por ejemplo DE-CIX, AMSIX, ESPANIX, CATNIX y muchos otros).

Centro de datos - Armarios para servidores y telecomunicaciones

Centro de datos - Armarios para servidores y telecomunicaciones

Todo ese complejo despliegue le permite a Google mantener el ritmo (con margen de sobra) del crecimiento de la WWW, cada día más y más dominios, más contenidos... Petabyte tras Petabyte...

¿Qué es un error de cobertura de índice?

Genéricamente es cualquier eventualidad que evite que Google pueda cumplir su misión de cobertura, de vigilancia permanente de lo que aparece, desaparece, reaparece o cambia en la WWW.

En términos informáticos generales existen 2 tipos básicos de incidencias: las controladas y las no controladas.
Las primeras son igual de malas que las segundas, pero tienen una diferencia básica: que son detectables y detectadas. Las no controladas simplemente suceden y se quedan ahí, esperando a ser detectadas y solucionadas. Si son fallos gordos nos daremos de bruces con ellos antes que después, pero si son minucias exóticas pueden quedar desatendidas por muchos años.

Los errores de cobertura de índice son del primer tipo: errores controlados.

¿Controlados por quién? Por Google.

¿Cómo los monitoriza Google? Al ser errores esperados, Google ya tiene sus protocolos y se basa en el rastreo para lanzar un aviso. Toda la evaluación de Google pasa por poder echar un vistazo a un recurso, la imposibilidad de hacer esa visita (o re-visita) se manifiesta mediante códigos de error pre-establecidos, universales y totalmente estandarizados.

¿Cuál sería un buen ejemplo de error monitorizado? El ejemplo típico que solemos ver todos con una respuesta estandarizada es un enlace roto.
Se dice que un enlace está roto cuando el tránsito del punto de origen al punto de destino se ve interrumpido por no encontrarse el punto de destino.
Es decir, la página A enlaza a la página B: el rastreador de Google (Googlebot) inspecciona la página A, lee su código fuente, encuentra los enlaces y los usa para "catapultarse" hacia otros recursos, en este caso la página B. Para que un enlace pueda hacerse se necesita una URL, una dirección web a la que apuntar; es decir definir el punto de destino.
Pero resulta que a veces la URL cambia o bien la propia página de destino (la B) desaparece.
Entonces el viaje de Googlebot acaba en la puerta del servidor web donde se sabe (DNS) que se encuentra alojada la página B. El servidor web le dice a Google que lo que busca siguiendo la URL de la página B, no se encuentra en el servidor. En el estándar que tanto Googlebot como el servidor web de turno conocen, el protocolo HTTP y sus códigos de respuesta, a esto se lo conoce como un Error404. Seguro que te suena :)

En la captura de los errores de cobertura de la consola Google, hemos visto 2 ejemplos claros:

  • Errores de servidor, reconocibles por pertenecer al grupo 5xx (siendo el 500 el más típico, "error de proceso del servidor" sin más).
  • Errores de servicio, reconocibles por pertenecer al grupo 4xx (siendo el 404 el más típico, "página no encontrada").

Los códigos HTTP no sirven solamente para informar de errores, también traen buenas y útiles noticias:

  • Contenido encontrado y entregado sin problemas, las mejores noticias tienen el código HTTP 200, "ok", sin más.
  • Contenido redirigido a una nueva ubicación, (debería ser) típico tras migraciones web, HTTP 301 o "redirección permanente".

¿Cuáles son las consecuencias de estos errores?

Las consecuencias de dejar desatendidos los errores de cobertura de índice de Google para tu sitio web serán más o menos graves en función del tipo de error y de la cantidad de errores independientemente del tipo.

Se considera una buena práctica que los errores tiendan a cero, esto puede ser fácil y muchas veces puede ser muy difícil. Tanto si cuidas de un sencillo blog personal como si cabalgas un ecommerce de 20.000 referencias el consejo es: mantener un ojo permanentemente en la consola de búsqueda de Google.

Fallar en el cuidado del equilibrio de la consola desembocará en problemas de diversa complejidad, con el agravante de que algunos de ellos tardan en provocar daños, y estos daños no son claramente discernibles hasta que ya duele mucho.

Las consecuencias de los errores no suelen ser inmediatas para problemas acumulativos, como podrían ser un incremento regular de enlaces rotos o de snippets negligentes.

Uno de los efectos negativos típicos de muchos enlaces rotos es la pérdida de recursos de rastreo, el crawl budget que mencionábamos anteriormente te será decrementado porque Google no querrá desperdiciar tiempo-Googlebot en algo que no funciona (los caminos internos de tu web, los enlaces internos rotos).

Hay cosas muy graves que aparecen directamente clasificadas como penalizaciones de Google, si llegas a ver una es mejor que le dediques atención inmediata y de calidad.

La primera señal de que algo marcha mal

Si te ha llegado un email de advertencia sobre un error de Cobertura de Índice es que algo va mal en tu web, situación que por lo expuesto admite grados.

Email de notificación de errores de cobertura de índice en la Consola de Búsqueda de Google

¿Cómo solucionar estos errores?

Solucionar estos errores de cobertura de índice y otras eventualidades pasa por la consola de búsqueda de Google y ponerse a rascar a detalle.

Si son errores programáticos y se identifican claramente, su resolución es masiva y en 48 horas (dato aproximado) el estado en la Search Console se normaliza

Un ejemplo de esto sería que se añada la coletilla "- Test de cambios SEO" a todos los

En proyectos web multiidioma suele pasar que con las prisas, se publica antes en el idioma de origen que en sus alternativas como Inglés o Alemán, sin esperar a las traducciones... Bueno, eso resulta en avisos de que faltan correspondencias entre idiomas: solamente se solucionará cuando publiques las versiones idiomáticas que faltan.

No nos cansamos de decir que el SEO no se alimenta de hechos aislados y dramáticos (robots aparte) por lo que deberías tener un ojo permanentemente en tu Consola de Búsqueda de Google.

Sabemos que ya tienes muy poco o ningún tiempo disponible, por eso ofrecemos el servicio de monitorización de Consola de Búsqueda de Google.

Expertos SEO profesionales y honestos, con centenas de consolas de experiencia.

¿Quién mejor?

Comentarios (0)

No hay comentarios.

Deja un comentario

Muestra de Clientes