La indexación de contenidos en Google es un factor importante que debe tenerse en cuenta para poder recibir al gran número de usuarios que podrían estar buscándo tus productos y servicios ahora mismo en internet.
Si cuando escribes el nombre de tu sitio web en el buscador, éste no aparece en los resultados, sigue leyendo todo lo que vamos a contarte sobre la indexación y cómo se consigue. En este artículo nos centraremos en la indexación en Google, por ser el motor de búsqueda más importante hoy en día, y el más utilizado. Si Google no indexa tu sitio web, por bien diseñado que esté, tenemos malas noticias: tu sitio web es prácticamente invisible. No aparecerá en ninguna consulta de búsqueda y no recibirá ningún tráfico.
El número de páginas en Internet es incontable, por ello, Google debe catalogar toda la información para poder ofrecer a los usuarios los mejores resultados posibles y que satisfagan sus necesidades, en el menor tiempo posible.
Para los que no tengáis claro lo que significa el término indexación, empecemos por el principio:
El término Indexación proviene del ingles, index, que significa índice en español.
La indexación es el proceso por el cual los motores de búsqueda anexan una página web a su índice para mostrarla en los resultados de una búsqueda.
Por tanto, la indexación consiste en la organización de datos en los buscadores según el esquema de cada página web.
De acuerdo a la definición de indexación en Wikipedia, este término se refiere a diversos métodos para incluir en el índice de internet el contenido de un sitio web.
El término indexación incluye aquellas acciones específicas que pueden realizarse dentro de un sitio web dirigidas a que los buscadores identifiquen las páginas de dicho sitio web y las categoricen en sus listados de resultados. Cuando las páginas han sido indexadas por los bots de los buscadores, son ofrecidas a los usuarios en función de las intenciones de búsqueda que realicen.
Una vez más, si un sitio web no está en el índice de un motor de búsqueda, los usuarios nunca podrán encontrarlo, exceptuando el caso de que conozcan e introduzcan la URL exacta a la cual quieren acceder.
IMPORTANTE: No se debe confundir el término indexación con el posicionamiento en buscadores porque son dos conceptos completamente diferentes. Para poner un ejemplo y aclarar cualquier duda existente, podríamos decir que indexar un sitio web sería presentarlo para participar en una carrera; y posicionarlo bien en buscadores u obtener los mejores resultados en Google, seria ganarla.
Los términos están relacionados porque un sitio web no puede ganar una carrera sin presentarse.
En este apartado queremos responder a la siguiente pregunta. ¿Cómo hace Google para reconocer nuevos sitios web y agregarlos a su índice?
El proceso de indexación se divide en tres etapas:
Para descubrir nuevas páginas web, Google rastrea la web para encontrarlas y posteriormente añadirlas a su índice (siguiente etapa). El termino rastrear se refiere a la acción de seguir hipervínculos en la web para descubrir nuevos contenidos.
Google cuenta con un software rastreador (crawler) llamado Googlebot que navega en la web en busca de nuevas páginas o actualizaciones en las páginas existentes de su índice.
Los Googlebots son los robots que Google utiliza para visitar los distintos sitios web. Rastrean el contenido y añaden lo que encuentran a la base de datos de Google. Dicho de otra manera, Googlebot es un software de búsqueda que Google envía a recopilar información y que se mueve de web en web a través de los enlaces.
Posterior al rastreo, tiene lugar la indexación (indexar significa almacenar todas las páginas web en una base de datos).
Una vez que descubre las nuevas páginas o las actualizaciones, Google interpreta su contenido, lo clasifica y lo añade a su índice, es decir, lo indexa.
Google aplica sus algoritmos a los datos disponibles y mide la frecuencia de diferentes factores en diferentes condiciones. El índice incluye:
En principio, se incluye todo lo que está dentro del código HTML de la URL.
Googlebot empieza a rastrear una página que ya tiene indexada. El rastreo empieza con los listados existentes de direcciones web de rastreos anteriores y con los mapas de sitios proporcionados por los propietarios de sitios webs. A medida que los Googlebots visitan estos sitios web, utilizan enlaces en esos sitios web para descubrir otras páginas. A partir de los enlaces, va conociendo nuevas páginas del mismo sitio. A continuación el robot o spider de Google, rastrea la nueva página, indexando todos los contenidos que va encontrando y así sucesivamente. Los Googlebots prestan especial atención a sitios nuevos, cambios a sitios existentes y enlaces.
La última fase de este proceso tiene lugar cuando un usuario realiza una búsqueda y Google, mediante sus algoritmos, identifica entre todos los datos de su índice cuál es la respuesta más relevante a la búsqueda del usuario.
Cuando un usuario realiza una búsqueda en Google, le está pidiendo a Google que le muestre todas las páginas relevantes dentro de su índice y que estén relacionadas con su búsqueda. Tal y como comentábamos anteriormente, existen millones de páginas en internet hoy en día, y son miles las que podrían relacionarse con la búsqueda del usuario. Por ello, Google ordena las páginas para que el usuario vea los resultados más relevantes primero.
Gran parte del tráfico que genera un sitio web proviene de los resultados de Google.
Lograr que tu sitio web aparezca en los resultados de Google es prácticamente imprescindible para recibir tráfico.
Cuando logras la indexación con éxito, consigues aumentar el tráfico a tu sitio web. Adicionalmente, cuando publicas contenidos nuevos serán descubierto por Google más rápidamente.
Si por el contrario, no has logrado indexar tu sitio web correctamente en Google, no aparecerá en los resultados de búsqueda.
También es posible que tu sitio web no haya completado la indexación en Google completamente lo cual podría tener consecuencias tales como por ejemplo, que Google ofrezca resultados hacia la página principal o home page de tu sitio web, pero no muestre todos los resultados relacionados con otras páginas dentro del sitio web.
Para resolver estos problemas, se deberá indicar a Google que su Googlebot debe visitar e indexar nuevamente un sitio web.
A continuación procederemos a ver las formas más importantes de conseguir indexar tu página web en Google.
En este apartado te presentamos los pasos más importantes que debes seguir para indexar correctamente una página web en Google. Empecemos por el principio:
La utilización de Google Search Console para conocer el estado de indexación de las páginas de tu sitio web es fundamental. Google Search Console es además una herramienta gratuita de Google, por tanto, ¡no hay excusa para no utlizarla!
Google Search Console puede mostrar errores de configuración y datos de analítica web que te ayudarán a identificar optimizaciones a realizar en tu sitio previos a la indexación, por ello hemos seleccionado su configuración previa a cualquier otro paso posterior.
Un sitemap es un mapa del sitio web que muestra información sobre sus páginas, contenidos y sus relaciones.
Un sitemap es tu propio índice de indexación para decirle exactamente al Googlebot lo que quieres que indexe de tu página. El archivo contiene las URLs de tu sitio web ordenadas jerárquicamente, lo que facilita la labor del bot en el rastreo e indexación.
La función del archivo robots.txt es indicarle a Google qué páginas y contenidos debe rastrear e indexar y cuáles no. Se utiliza para evitar que las páginas que no deseas aparezcan como resultados de una búsqueda. Aún así, debe tenerse en cuenta que poner determinadas páginas en el archivo robots.txt no garantiza que no se indexen. Para garantizar su no indexación deberás establecerlas como noindex con una meta-etiqueta.
Importante: Si Google no está indexando tu sitio web completamente puede ser debido a un bloqueo de rastreo en un archivo robots.txt.
Para comprobar si este es el error que está ocurriendo, introduce la URL en la herramienta de inspección de URLs en Google Search Console. Haz clic en el bloque de Cobertura y busca el error de “¿Se permite el rastreo? No: bloqueado por un error de robots.txt” el cual indicaría que la página está bloqueada en robots.txt.
También puedes ir a a tudominio.com/robots.txt y buscar cualquier regla de “disallow” .
Entendemos que los términos técnicos pueden resultarte difíciles, pero no te preocupes y si necesitas ayuda, ponte en contacto con nuestros expertos en Kiwop.
Haz un buen estudio de keywords sobre la temática de tu sitio web para favorecer la indexación.
Si quieres aparecer en determinadas búsquedas, deberás usar las keyword específicas con una densidad adecuada en las página de tu sitio web.
Añade las palabras clave en tus nuevos contenidos, y actualiza los existentes con frecuencia.
Cuando agregas contenido nuevo y actualizas el contenido existente regularmente, estás informando a Google que haces cambios en tu sitio web constantemente, y consecuentemente, que tu sitio web está al día y actualizado.
Google prioriza los contenidos frescos frente a los desactualizados, pero más importantemente, añadir nuevos contenidos obliga a Googlebot a rastrear tu sitio web con frecuencia.
Por tanto, la creación de contenidos es una tarea relevante dentro de tus estrategias de indexación y posicionamiento.
Una buena estrategia de link building interno ayudará al bot a rastrear de un enlace a otro. Siempre que puedas, al escribir en tu blog, pon un enlace interno a otro contenido tuyo. Para más información, no te pierdas nuestro artículo y guía definitiva de linkbuilding interno.
Consigue que sitios web que sean reconocidos por Google enlacen a tu página, o enlaza contenidos relevantes de estos sitios en tus propias publicaciones. Es importante no utilizar malas prácticas tales como comprar enlaces falsos, aaunque sea a largo plazo, es mejor apostar por backlinks de gran autoridad y relevancia!
Si Googlebot detecta que hay enlaces rotos (enlaces o URL de tu sitio web que no llevan a ningún sitio) estarás complicando el proceso de indexación. Por ello, es importante detectar los enlaces rotos y crear redireccionamientos para no comprometer la experiencia del usuario. A continuación te proponemos algunas herramientas para detectar enlaces defectuosos.
Nunca indexamos todas las URLs conocidas, eso es bastante normal. Yo me enfocaría en hacer el sitio impresionante e inspirador, entonces las cosas suelen funcionar mejor.
John Mueller
Lo que John Mueller quiere decir con esta frase, es que para que Google indexe tu sitio web, tiene que ser único e impresionante.
Por otra parte, es probable que Google NO indexe las páginas de baja calidad porque no tienen ningún valor para sus usuarios. Revisa las páginas de tu sitio web que no estén indexadas por problemas de calidad y efectúa los cambio necesarios antes de solicitar la re-indexación en Google Search Console. Otra opción, para ahorrar en presupuesto de indexación, es eliminar las páginas de mala calidad, le estarás ahorrando trabajo al Googlebot.
La indexación es previa al posicionamiento. No sirve de mucho aparecer en la tercera página de resultados cuando el 75% de los clics se quedan en los 5 primeros resultados.
Tener un sitio web bien posicionado puede mejorar tu autoridad de dominio y mostrarle a Google que tu sitio web ofrece a los usuarios contenido de valor. Ya sabes que el contenido de valor le encanta a Google y por ello indexará rápidamente y sin problemas todo tu contenido nuevo.
No te pierdas nuestros artículos sobre por qué invertir en SEO, y cuánto invertir en SEO. Si necesitas un experto en SEO, ponte en contacto con nosotros, en Kiwop te ayudamos a mejorar tus resultados.
Si quieres tener la web que deseas o aumentar la visibilidad online de tu marca, sabemos cómo hacerlo.
¿Empezamos hoy?
Deja una respuesta