Todos aman los «hacks».
No soy la excepción––Me encanta encontrar formas de hacer mi vida mejor y más fácil.
Es por esto que la técnica que te contaré hoy es una de mis favoritas. Es un hack de posicionamiento en buscadores que puedes comenzar a utilizar de manera inmediata.
Es una forma de acrecentar tu SEO al aprovechar una parte natural de cada sitio web que muy raramente se menciona. Tampoco es difícil incorporarla.
Es el archivo robots.txt (también llamado protocolo o estándar para la exclusión de los robots).
Este pequeño fichero de texto es una parte de cada sitio web en internet, mas la mayoría de las personas no lo conocen.
Está diseñado para funcionar con los motores de búsqueda, mas sorprendentemente, es una fuente poder posicionamiento web en buscadores que está esperando a ser descubierta. agencia seo la moraleja /p>
He visto a muchos clientes hacer de todo para prosperar el posicionamiento en buscadores de su sitio. Cuando les digo que pueden editar un pequeño archivo de texto, prácticamente no me creen.
Sin embargo, hay muchos métodos para mejorar tu posicionamiento en buscadores que no son difíciles ni te quitan mucho tiempo, y éste es uno de ellos.
No precisas tener ninguna experiencia técnica para aprovechar el poder de los robots.txt. Si puedes hallar el código fuente para tu sitio, puedes utilizar esto.
Cuando estés listo, sígueme y te explicaré la manera en la que puedes cambiar tu fichero de robots.txt a fin de que a los motores de búsqueda les guste.
Descubre cómo aproveché el posicionamiento SEO para.
Primero, echemos un vistazo al porqué es esencial el archivo robots.txt.
El fichero robots.txt, también conocido como el protocolo o estándar de exclusión de robots, es un fichero de texto que les afirma a los robots web (motores de búsqueda) qué páginas de tu sitio deben rastrear.
También les dice a los robots web qué páginas
no debenrastrear.
Supongamos que un motor de búsqueda está a puntito de visitar un sitio web. Antes de que visite la página objetivo, comprobará el fichero de robots.txt para percibir instrucciones.
Existen distintos géneros de archivos robots.txt, así que echemos una ojeada a los diferentes géneros de apariencia que tienen.
Digamos que el motor de búsqueda encuentra:
Esta es la columna vertebral del fichero robots.txt.
El asterisco después de «user-agent» significa que el archivo robots.txt está abierto a todos y cada uno de los robots que visiten el sitio web.
La diagonal después de «Disallow» le dice al robot que no visite ninguna página en el sitio web.
Quizá te estés preguntando por qué alguien querría eludir que los robots web visitaran su sitio web.
Después de todo, uno de los principales objetivos del SEO es lograr que los motores de búsqueda rastreen tu sitio de una forma más fácil para incrementar tus rankings.
Aquí es donde se encuentra el secreto de este hack de posicionamiento web en buscadores.
Probablemente tengas muchas páginas en tu sitio web, ¿verdad? Aun si consideras que no es así, revísalo. Quizá te sorprendas.
Si un motor de búsqueda rastrea tu sitio web, éste rastreará cada una de tus páginas.
Y si tienes muchas páginas, le llevará pero tiempo rastrearlas al bot del motor de búsquedas, lo que tendrá efectos negativos en tu ranking.
Esto se debe a que el Googlebot (el bot del motor de búsqueda de Google) tiene un «presupuesto de rastreo.»
Esto se divide en 2 partes. El primero es una tasa límite de rastreo.:
La segunda parte es una demanda de rastreo:
Básicamente, el presupuesto de rastreo es «el número de URLs que el Googlebot puede y desea rastrear».
Necesitas ayudar al Googlebot a invertir su presupuesto de rastreo para tu sitio web de la mejor manera posible. analisis seo valladolid , debería emplear el tiempo en rastrear tus páginas más valiosas.
Existen algunos factores que, conforme con Google, «afectarán de manera negativa el rastreo y la indexación de un sitio.»
Estos son esos factores:
Volvamos al fichero robots.txt.
Si creas la página correcta de robots.txt, puedes decirle a los bots de los motores de búsqueda (y singularmente al Googlebot) que eviten ciertas páginas.
Piensa en lo que esto implica. Si le dices a los bots de los motores de búsqueda que solamente rastreen tu contenido más útil, los bots rastrearán y también indexarán tu sitio con el foco en ese contenido únicamente.
:
«No deseas que tu servidor se sienta abrumado por el rastreador de Google o bien desperdiciar presupuesto de rastreo al rastrear páginas no esenciales en tu sitio.»
Al utilizar tu robots.txt de la manera correcta, puedes decirle a los bots de los motores de búsqueda que inviertan su presupuesto de rastreo inteligentemente. Y eso es lo que hace que el fichero robots.txt sea tan útil en un contexto de posicionamiento web en buscadores.
¿Te sientes intrigado por el poder de los robots.txt?
¡Pues deberías! Charlemos sobre cómo encontrarlo y usarlo.
Si sólo quieres echar un rápido vistazo a tu fichero robots.txt, existe una manera súper fácil.
De hecho,
este método funcionará con cualquier sitio web.Por lo que puedes echar un vistazo a los ficheros de otros sitios web y ver lo que están haciendo.
Lo único que tienes que hacer es teclear la URL básica del sitio en la barra de búsquedas de tu navegador (ejemplo: neilpatel.com, quicksprout.com, etc). Y después agregar /robots.txt al final.
Te encontrarás con una de estas 3 situaciones:
1) Encontrarás un archivo robots.txt.
2) Encontrarás un fichero vacío.
Por ejemplo, parece queno tiene un archivo robots.txt:
3) Obtendrás un error 404.
muestra un fallo cuatrocientos cuatro con archivos robots.txt:
Echa un segundo vistazo a tu propio archivo de robots.txt.
Si encuentras un archivo vacío o seo para clinicas dentales , necesitarás solventarlo.
Si encuentras un archivo válido, probablemente tiene la configuración predeterminada que fue creada cuando hiciste tu sitio.
Me agrada este método singularmente para ver los archivos robots.txt de otros sitios. Cuando aprendas cómo funcionan los ficheros robots.txt, este método puede ser un valioso ejercicio.
Ahora veamos cómo cambiar tu fichero robots.txt.
Tus siguientes pasos dependerán de si tienes un fichero robots.txt. (Examina si lo tienes al usar el método que describí anteriormente).
Si no tienes un archivo robots.txt, necesitarás crear uno desde cero. Abre un editor de texto como el Bloc de Notas (en Windows) o bien TextEdit (Mac).
Solamente usa un
editor de texto planopara esto. Si usas programas como Microsoft Word, el programa podría introducir código adicional al texto.
Editpad.org es una excelente opción gratuita, y es lo que me verás usando en este artículo.
Volvamos a los robots.txt. Si tienes un fichero robots.txt, necesitarás ubicarlo en el directorio root de tu sitio web.
Si no estás acostumbrado a adentrarte en el código fuente, podría ser un poco difícil ubicar la versión editable de tu fichero robots.txt.
Normalmente, puedes encontrar tu directorio root al ir al sitio web de tu proveedor de alojamiento, entrar, y también ir a la sección de administración de ficheros o FTP de tu sitio web.
Deberías ver algo así:
Encuentra tu fichero robots.txt y ábrelo para editarlo. Borra todo el texto, mas mantén el archivo.
Nota: Si estás usando WordPress, quizá veas un fichero robots.txt cuando vayas a tusitio.com/robots.txt, pero no podrás hallarlo en tus ficheros.
Esto es debido a quesi no hay robots.txt en el directorio root.
Si esto te sucede, necesitarás crear un nuevo archivo robots.txt.
Puedes crear un nuevo fichero robots.txt al emplear el editor de texto plano que escojas. (Recuerda, usa solamente un editor de texto plano).
Si ya tienes un fichero robots.txt, asegúrate de que has borrado el texto (mas no el fichero).
Primero, necesitarás familiarizarte con algo de la sintaxis utilizada en un fichero robots.txt.
de ciertos elementos básicos de robots.txt:
Te voy a mostrar cómo configurar un fichero robots.txt fácil, y después vamos a echar un vistazo a cómo personalizarlo para tu SEO.
Comienza fijando el término user-agent. Vamos a configurarlo de forma que esté abierto a todos los robots web.
Puedes lograr esto al usar un asterisco después del término usuario-agent, así:
Después, teclea «Disallow:» pero no teclees nada después de eso.
Debido a que no hay nada después de disallow, los robots web se dirigirán a rastrear todo tu sitio. En este momento, todos los elementos de tu sitio serán vulnerables.
Hasta este instante, tu archivo robots.txt debería verse así:
Sé que se ve súper sencillo, pero estas dos líneas están haciendo mucho por tu sitio.
También puedes crear un link a, pero no es necesario. Si deseas, esto es lo que puedes escribir:
Aunque no lo creas, así debería verse un archivo robots.txt básico.
Ahora llevemos esto al siguiente nivel y transformemos este pequeño fichero en un potenciador posicionamiento web en buscadores.
El cómo optimices tus robots.txt depende del contenido que tengas en tu sitio. Existen tres géneros de formas en las que puedes utilizar los robots.txt a favor tuyo.
Voy a ver contigo algunas de las formas más comunes de emplearlo.
(Ten presente que
nodeberías utilizar robots.txt para bloquear páginas de los motores de búsqueda.Eso sería un gran no-no).
Uno de los mejores usos del archivo robots.txt es aumentar al máximo los presupuestos de rastreo de los motores de búsqueda al decirles que no rastreen las unas partes de tu sitio web que no se muestran públicamente.
Por ejemplo, si visitas el fichero robots.txt de este sitio (neilpatel.com), verás que tiene bloqueada la página de login (wp-admin).
Debido a que esta página se utiliza para entrar a la parte privada del sitio web, no tendría mucho sentido para los bots de los motores de búsqueda desaprovechar su tiempo rastreándola.
(Si tienes WP, puedes usar la misma línea disallow).
Puedes emplear una indicación afín (o bien comando) para evitar que los bots rastreen páginas específicas. Después del disallow, introduce la una parte de la URL que viene después del .com. Pone eso entre las 2 diagonales.
Si deseas decirle a un bot que no rastree tu página, puedes teclear esto:
Quizá te estés preguntando qué tipos de páginas deberías excluir de indexación. Aquí hay dos escenarios comunes en donde esto puede suceder:
Contenido intencionalmente duplicado. Si bien el contenido duplicado es en gran parte algo malo, existen unos cuantos casos en los que es necesario y aceptable.
Por ejemplo, si tienes una versión imprimible de tu página, técnicamente tienes contenido duplicado. En un caso así, podrías decirle a los bots que no rastreen una de esas versiones (generalmente, la versión imprimible).
Esto es muy útil si estás haciendo split testing con páginas que tienen el mismo contenido pero diseños distintos.
Páginas de gracias.La página de GRACIAS es una de las páginas favoritas de los marketers porque significa un nuevo lead.
¿Verdad?
Al parecer,
algunas páginas de gracias son alcanzables a través de Google.Esto significa quesin pasar por el proceso de atrapa de leads, y esto no es bueno.
Al bloquear tus páginas de
gracias, puedes cerciorarte de que únicamente los leads cualificados estén viéndolas.
Pongamos que tu página de gracias se halla en. En tu fichero robots.txt, bloquear esa página se vería así:
Debido a que no hay reglas universales para saber qué páginas desautorizar, tu archivo robots.txt será único en tu sitio. Utiliza tu propio criterio aquí.
Existen otros dos géneros de comandos que deberías conocer:
noindex y nofollow.
¿Sabes qué comando disallow hemos estado utilizando? En realidad no evita que esa página sea indexada.
En teoría, podrías desacreditar una página, pero aun así, podría terminar en el índice.
Generalmente, no te resulta interesante eso.
Es por eso que necesitas el comando noindex, que marcha con el comando disallow para asegurar que no los bots no visiten o indexen ciertas páginas.
Si tienes ciertas páginas que no deseas que se indexen (como las páginas de gracias), puedes emplear los dos comandos, disallow y noindex:
Ahora sí, esa página no se mostrará en las SERPs.
Finalmente, tenemos el comando nofollow. En verdad, es la mismo que el. En resumen, le dice a los robots web que no rastreen los links en una página.
Pero el comando nofollow vamos a implementarlo de una forma un poco diferente, porque en realidad no forma parte del fichero robots.txt.
Sin embargo, el comando nofollow sigue dando indicaciones a los robots web, con lo que es el mismo término. La única diferencia radica en dónde se implementa.
Encuentra el código fuente de la página que desees mudar, y
asegúrate de que esté entre las etiquetas <head>.
Después, queja esta línea:
<meta name=»robots» content=»nofollow»>
De manera que se vea así:
Asegúrate de no estar poniendo esto entre alguna otra etiqueta––sólo las etiquetas <head>.
Esta es otra genial opción para tus páginas de
gracias, dado a que los robots web no rastrearán enlaces a ningún imán de leads u otro contenido exclusivo.
Si deseas agregar los dos comandos: noindex y nofollow, emplea esta línea de código:
<meta name=»robots» content=»noindex,nofollow»>
Esto le dará a los robots web ambos comandos al mismo tiempo.
Finalmente, haz pruebas con tu archivo robots.txt para estar seguro de que todo es válido y funciona de la forma correcta.
Google pone a tu disposición un ecosistema de pruebas para robots.txt como parte de sus herramientas para Administradores web.
Primero, entra enal hacer clic en «Acceder» en la esquina superior derecha de tu pantalla.
Selecciona tu propiedad (ejemplo: sitio) y haz click en «Rastrear» al lado izquierdo de tu pantalla.
Verás el
testerde «robots.txt.» Haz click ahí.
Si ya hay algún código en esa sección, bórralo y reemplázalo con tu nuevo fichero robots.txt.
Haz clic en «Probar» en la esquina inferior derecha de la pantalla.
Si el texto de «Probar» cambia a «Permitido,» eso significa que tu fichero robots.txt es válido.
sobre la herramienta para que puedas aprender qué significa todo con más detalle.
Finalmente, sube tu archivo robots.txt a tu directorio root (o bien guárdalo ahí si ya tenías uno). Ahora tendrás como arma un poderoso fichero, y deberías ver un aumento en tu visibilidad de búsqueda.
Siempre me gusta compartir pequeños «hacks» de posicionamiento en buscadores que te pueden dar una ventaja real de muchas maneras.
Al configurar tu fichero robots.txt apropiadamente, no sólo estás mejorando tu posicionamiento web. También estás ayudando a tus usuarios.
Si los bots de los motores de búsqueda pueden emplear sus presupuestos de rastreo inteligentemente, organizarán y mostrarán tu contenido en las Search Engines Ranking Positions de una mejor forma, lo que significa que tendrás mayor visibilidad.
Tampoco lleva mucho esfuerzo para configurar tu archivo robots.txt. Podríamos decir que es una configuración que se hace una sola vez, y puedes hacer tantos pequeños cambios como necesites por el camino.
Ya sea con tu primer sitio o bien con el quinto, usar robots.txt puede suponer una diferencia significativa. Te invito a darle una vuelta si no lo has hecho ya antes.
¿Cuál es tu experiencia al crear ficheros robots.txt?