¿Por qué Google no indexa mi página?
Una de las cuestiones más importantes de SEO es la indexación. Gracias a esto, su sitio web es visible en el motor de búsqueda y sus subpáginas individuales exactas se muestran con frases clave específicas. Sin embargo, hay situaciones en las que, a pesar de que publicas regularmente algún contenido en el dominio o creas artículos, el motor de búsqueda no lo ve o no lo actualiza.
¿Cuál podría ser la razón? ¿Cuáles son las causas de los problemas de rastreo que pueden impedir que se visite su sitio? En este artículo te lo decimos:
¿Qué es la indexación?
La indexación no es más que el proceso de colocar dominios, sus subpáginas, contenido y toda la información contenida en las páginas en el motor de búsqueda. Sin embargo, antes de que Google pueda indexar sus páginas, debe descubrirlas.
Si alguno de los procesos de indexación sale mal, puede haber problemas con la visibilidad del dominio para los usuarios. En la mayoría de los casos, Google indexará cada subpágina actualizada o nueva. Esta es una parte fundamental de lo que es un motor de búsqueda. Esto sucede en diferentes momentos. Desafortunadamente, este tiempo no está definido actualmente y puede demorar entre varias horas y varios días. Sin embargo, hay muchas razones por las que Google puede rechazar su dominio a través de la indexación.
¿Cómo puedo verificar si mi sitio web está indexado?
La forma más popular de verificar la indexación de un dominio es ingresar la fórmula "sitio: miweb.com" en Google. Es mejor usar la fórmula sin http, https o www, es decir, "sitio: miweb.com" (www generalmente se trata como un subdominio). Esta fórmula se ingresa directamente en el campo de búsqueda. Muestra la mayoría (pero probablemente no todas) de las subpáginas indexadas de su dominio.
Es posible que Google no muestre todas las subpáginas indexadas, y esto es especialmente popular con dominios grandes (por ejemplo, tiendas), porque algunas subpáginas pueden estar en un servidor de Google diferente (en un índice diferente), muy generalmente.
Después de la fórmula "sitio:", también puede ingresar una subpágina específica y verificar su estado de índice.
Google Search Console: estado del índice
El segundo método popular es la verificación de datos en Google Search Console. Sin embargo, para obtener esta información, debe implementar el código apropiado que recopila datos en el sitio web. Una vez que esté en el panel de GSC, puede verificar el "estado del índice". Los gráficos allí le permitirán ver (más o menos) cuántas subpáginas de su sitio web están indexadas en el motor de búsqueda. También puede consultar allí cuántos enlaces se han bloqueado o eliminado. Todos estos y otros datos aparecen en el gráfico y en cifras también en el rango histórico. Esto le permite controlar el estado del índice de su dominio a lo largo del tiempo.
Google Search Console - Comprobación manual de URL
Al mismo tiempo, puede buscar una dirección en Google Search Console manualmente en el Comprobador de URL. Para hacer esto, debe ingresar la dirección completa que puede ser un problema en el motor de búsqueda en la parte superior. Si recibe un mensaje de que la subpágina no está indexada, puede buscar otra razón.
Consola de búsqueda de Google - mapa del sitio
Otra forma de verificar la indexación es cargar información sobre el archivo del mapa del sitio (que es una lista de todas las subpáginas del dominio) en Google Search Console y luego analizar la cantidad de enlaces al motor de búsqueda en este mapa. En resumen, después de un tiempo, puede ver cuántos enlaces se enviaron y cuántos de ellos se indexaron realmente. También gracias a la comparación de datos del "estado de índice".
Si el dominio se ha mostrado hasta ahora después de ingresar frases clave específicas en Google, y esta vez no está visible (después de excluir la clásica posición desplegable) incluso en TOP100, esto también puede ser un signo de indexación de subpáginas individuales. En ocasiones se asocia, por ejemplo, a un virus en la web, pero la imagen suele estar visible en el citado Google Search Console.
¿Qué podría estar causando problemas de indexación?
Los problemas de indexación generalmente son causados por elementos comunes. Compruebe por qué su sitio web no está indexado. Los motivos más habituales son:
Asegúrate de que tu dominio no tenga asignados los atributos "noindex" y/o "nofollow". Googlebot visita el sitio para determinar, entre otras cosas, qué páginas se pueden rastrear o simplemente indexar. En otras palabras, su función es informar al motor de búsqueda sobre subpáginas o páginas completas que Google también puede visitar más adelante (por ejemplo, en el proceso de ingreso de una frase por parte del usuario). Por lo tanto, debe asegurarse de no tener ninguno de los atributos mencionados anteriormente en su página, ya que impedirían la indexación de los motores de búsqueda.
<meta nombre = “robots” contenido “inoindex”>
<meta nombre = "googlebot" contenido = "noindex">
Verifique las reglas en el archivo robots.txt. Este archivo se encuentra en el servidor en el directorio principal del sitio web, por lo que debe estar visible en la ruta: www.miweb.com/robots.txt . Asegúrese de que no haya mensajes que bloqueen el rastreo o la entrada del rastreador de Google. En primer lugar, verifique a qué subpágina está asignada la etiqueta Disallow, por ejemplo:
Disallow: / - bloquea toda la página.
Disallow: /directory/: bloquea un directorio de página específico.
Sucede que la subpágina que debería estar disponible para Googlebot está bloqueada por accidente. Ten en cuenta que algunas subpáginas o directorios están bloqueados a propósito, para no crear, por ejemplo, copias internas, no dirigir a los usuarios a algún sitio, etc.
Al igual que con el archivo robots.txt, verifique los comandos ingresados en el archivo .htaccess. Suele estar oculto en el servidor en la carpeta WWW o en el directorio public_html. .htaccess configurado incorrectamente puede causar, por ejemplo, bucles de redireccionamiento, lo que evitará que se indexen las subpáginas.
Mapa del sitio: el archivo sitemap.xml también se encuentra en el servidor y generalmente se encuentra en: domena.pl/sitemap.xml. Este archivo es una tabla de contenido de todas las subpáginas activas en el dominio, es un menú para Googlebot. Verificar su corrección y, sobre todo, su estado de actualización.
¡Pero no lo es todo! Un archivo sitemap.xml correctamente configurado y actualizado debe estar en Google Search Console y, de hecho, la ruta debe colocarse allí (es decir, el mencionado dominio.pl/sitemap.xml). Esto se hace en la sección correspondiente en el GSC, donde indica en qué parte del servidor se encuentra este archivo.
La verificación de GSC se lleva a cabo casi de inmediato y le permitirá determinar si el archivo de la página se creó correctamente (es decir, si contiene las fórmulas correctas). Sin embargo, en esta sección no verificará que todas las subpáginas estén en el índice.
En última instancia, cada subpágina, sin "noindex" y que se muestre correctamente en el dominio (después de excluir todos los demás posibles problemas), colocada en el archivo sitemap.xml y enviada al GSC, tarde o temprano debería indexarse.
La causa inmediata y bastante común de la falta de indexación son problemas en el servidor, con conectividad general o con DNS. El efecto es que Googlebot no podrá acceder a su página o solo a una subpágina que desee indexarla. Los errores del servidor 5xx (por ejemplo, 500, 503) suelen impedir que los usuarios ingresen al sitio, lo mismo sucede con el robot de Google cuando el sitio no tiene el estado de 200.
El historial del dominio también puede ser un problema en la indexación. Al crear un nuevo sitio web y buscar un nombre de dominio, asegúrese de que su historial sea claro. Si el dominio se usó anteriormente y Google lo consideró, por ejemplo, como un generador de spam (porque era una granja de enlaces, un directorio o incluso propagaba pornografía), entonces también puede haber problemas con la indexación más adelante, incluso después de enviar con éxito un mapa del sitio en Google. Consola de búsqueda.
Otra causa bastante general de los problemas de indexación puede ser que se haya encontrado que el contenido de su dominio es una copia de otro contenido. Este es un caso bastante raro, pero cuando la gran mayoría de, por ejemplo, descripciones de categorías, productos se copian uno a uno desde otro sitio web, el valor de información de su dominio es igual a "0".
A veces, el uso de enlaces canónicos incorrectos también puede causar problemas de indexación. Los enlaces canónicos le dicen a Googlebot qué subpágina es la subpágina principal y preferida. Suelen ser útiles si tenemos dos versiones de una misma subpágina, o tenemos dos dominios desde los que copiamos directamente. Crear enlaces canónicos incorrectos, por ejemplo, que conduzcan a subpáginas que no existen o que no son la versión original, puede generar problemas con la indexación.
¿Cuál es el valor de su sitio web?
En resumen, para que una página esté correctamente indexada, se somete a una especie de control de calidad. Este control se lleva a cabo en varias etapas e incluye muchos elementos que en la mayoría de los casos son compatibles con los llamados factores de clasificación.
Google no revela explícitamente cómo evalúa el sitio, pero se supone que se basa en los factores de calidad antes mencionados. Incluyen no solo los elementos mencionados anteriormente (como el correcto funcionamiento del servidor, el mapa del sitio, las fórmulas apropiadas contenidas en el archivo robots.txt), sino también, por ejemplo, la evaluación de la estructura de enlaces internos o enlaces externos ( llamadas actividades fuera del sitio).
Recuerda que indexar no es igual a estar arriba en el ranking (en el TOP 10). La indexación significa que la página se tiene en cuenta para lograr la posición esperada de las frases clave. Simplemente indexando su sitio, no obtendrá un gran tráfico y vistas. Por eso existe una optimización a medida para el posicionamiento web. El SEO (posicionamiento) incluye, entre otras cosas, ajustar la página a los factores de clasificación antes mencionados, gracias a los cuales Google evaluará mejor su sitio según su clasificación de usabilidad (en relación con el usuario).
No se quede atrás y no dé motivos a Googlebot para que le dé una puntuación baja a su sitio. Deshazte de los problemas técnicos que pueden sorprenderte y causar problemas de indexación incluso en el futuro.
Te puede interesar