Gratis y centrado en la privacidad

Probador de Robots.txt

Última actualización:

Prueba reglas de robots.txt contra user-agent y rutas URL con lógica de precedencia determinista.

Se ejecuta localmente en su navegador. Sus datos no salen del dispositivo.

Que resuelve esta herramienta

Que resuelve esta herramienta

Usa esta herramienta cuando necesites una decisión de rastreo por URL para un bot específico: antes de desplegar un cambio en robots.txt, después de una migración de CMS, o cuando un crawler se comporta inesperadamente en una ruta que creías abierta.

Valores de entrada

Resultados

Cómo leer los resultados

El resultado para cada URL muestra tres cosas: el grupo de user-agent coincidente, la regla ganadora y el veredicto final de allow o disallow. Un resultado allow limpio significa que la URL pasa la verificación de robots. Un resultado disallow con una regla ganadora específica muestra exactamente qué directiva está bloqueando la ruta. Si ninguna regla coincidió, la URL está implícitamente permitida.

Supuestos

  • La resolución usa la ruta más larga coincidente; en empate prioriza Allow.
  • El parser es determinista y no descarga robots.txt remotos.

Siguiente paso

Explora el siguiente paso

Prueba reglas de robots.txt contra user-agent y rutas URL con lógica de precedencia determinista.

Revisión editorial

Cómo se construyó esta página

Esta página combina la herramienta en vivo, ayuda de entradas, ejemplos trabajados y límites operativos para que Probador de Robots.txt sea útil sin depender de anuncios.

Revisado por Klartext Tools frente al flujo actual de Probador de Robots.txt el 2026-03-06.

Última actualización:

Usar con criterio

Supuestos

  • La resolución usa la ruta más larga coincidente; en empate prioriza Allow.
  • El parser es determinista y no descarga robots.txt remotos.

Alcance de la página

Qué cubre esta página

  • Cómo usar esta herramienta
  • Entradas y escenarios de ejemplo
  • Cómo leer los resultados
  • Casos de uso
  • Por qué esto importa
  • Qué hace esta herramienta

Ejemplos trabajados

Bloqueo básico de admin

Una configuración común que bloquea un área admin pero permite una ruta de ayuda específica y una ruta de vista previa para Googlebot.

User-agent a probar
Googlebot
Modo de sintaxis
Strict
Modo de coincidencia
Solo ruta

Útil para ver como una regla allow más específica puede anular un patrón disallow más amplio.

Cambia el user-agent después de cargar el ejemplo para comparar cómo varía el veredicto para otros crawlers.

Regla de búsqueda sensible a query

Un conjunto de reglas que solo funciona cómo se espera cuando los query strings se incluyen en la lógica de coincidencia.

User-agent a probar
*
Modo de sintaxis
Strict
Modo de coincidencia
Ruta + query

Útil para verificar si el manejo de query strings cambia una decisión de rastreo para URLs de búsqueda o checkout.

Cambia el modo de coincidencia a solo ruta después de cargar el ejemplo para ver cómo cambia el veredicto.

Cómo usar esta herramienta

Pega el contenido de robots.txt que quieres probar: no solo la sección relevante, sino el archivo completo para que las interacciones de grupo se resuelvan correctamente.

  1. Pega el contenido completo de robots.txt en el área de entrada.

  2. Introduce el nombre del user-agent que quieres probar, cómo Googlebot o un token de crawler personalizado.

  3. Añade las rutas URL a verificar, una por línea: usa URLs completas o cadenas de solo ruta.

  4. Elige el modo de sintaxis strict o permisivo y si incluir query strings en la coincidencia.

  5. Ejecuta el tester y verifica el grupo coincidente, la regla ganadora y el veredicto de allow o disallow para cada ruta.

Entradas y escenarios de ejemplo

Carga un archivo de control de rastreo simple o un conjunto de reglas sensibles a query para probar precedencia, anulaciones allow y targeting de user-agent.

Bloqueo básico de admin

Una configuración común que bloquea un área admin pero permite una ruta de ayuda específica y una ruta de vista previa para Googlebot.

Entradas de ejemplo

User-agent a probar
Googlebot
Modo de sintaxis
Strict
Modo de coincidencia
Solo ruta

Resultado de ejemplo: Útil para ver como una regla allow más específica puede anular un patrón disallow más amplio.

Cambia el user-agent después de cargar el ejemplo para comparar cómo varía el veredicto para otros crawlers.

Regla de búsqueda sensible a query

Un conjunto de reglas que solo funciona cómo se espera cuando los query strings se incluyen en la lógica de coincidencia.

Entradas de ejemplo

User-agent a probar
*
Modo de sintaxis
Strict
Modo de coincidencia
Ruta + query

Resultado de ejemplo: Útil para verificar si el manejo de query strings cambia una decisión de rastreo para URLs de búsqueda o checkout.

Cambia el modo de coincidencia a solo ruta después de cargar el ejemplo para ver cómo cambia el veredicto.

Por qué esto importa

Las reglas de robots.txt interactúan de formas no siempre intuitivas: los grupos de user-agent específicos anulan al wildcard, las directivas allow más largas tienen precedencia sobre las disallow más cortas, y algunos crawlers interpretan la sintaxis de forma diferente. Sin pruebas explícitas, es difícil saber qué URLs están realmente bloqueadas para qué bots. Esta herramienta ejecuta la lógica de precedencia determinista de robots.txt contra las URLs y user-agents que especifiques para que puedas verificar el comportamiento antes de publicar cambios.

Qué hace esta herramienta

Pega el contenido de tu robots.txt, introduce el nombre del crawler que quieres probar y proporciona una o más rutas URL. El tester evalúa qué grupo de user-agent aplica, encuentra la directiva coincidente más específica y devuelve un veredicto de allow o disallow para cada URL: junto con la regla ganadora y el grupo que la rige.

Cómo funciona la precedencia en robots.txt

Cuando múltiples reglas podrían coincidir con una URL, gana la coincidencia de ruta más larga independientemente del orden de las reglas. Una directiva allow específica para /admin/help/ supera un disallow más amplio para /admin/ porque es más larga. Si dos reglas tienen la misma longitud de ruta, allow tiene precedencia sobre disallow. Los grupos de user-agent específicos tienen prioridad sobre el grupo wildcard (*).

Coincidencia de grupos de user-agent

El tester primero busca un grupo que nombre exactamente el user-agent introducido (sin distinguir mayúsculas). Si no existe un grupo nombrado, recurre al grupo wildcard (*). Un bot que coincide con un grupo nombrado no está también gobernado por el grupo wildcard: solo aplica la coincidencia más específica.

Cómo leer los resultados

El resultado para cada URL muestra tres cosas: el grupo de user-agent coincidente, la regla ganadora y el veredicto final de allow o disallow. Un resultado allow limpio significa que la URL pasa la verificación de robots. Un resultado disallow con una regla ganadora específica muestra exactamente qué directiva está bloqueando la ruta. Si ninguna regla coincidió, la URL está implícitamente permitida.

Modo de sintaxis strict vs permisivo

El modo strict marca directivas que no se ajustan precisamente a la especificación robots.txt: útil cuando quieres detectar casos límite que algunos crawlers podrían rechazar. El modo permisivo aplica un parser más tolerante que acepta patrones informales comunes. Usa el modo strict antes de desplegar cambios en un archivo de producción; usa el modo permisivo cuando analices un archivo existente que no escribiste tú.

Coincidencia solo de ruta vs ruta y query

Por defecto el tester coincide solo en la ruta URL, ignorando los query strings: que es cómo se comportan la mayoría de los crawlers principales. Cambiar al modo ruta y query incluye el query string completo en la coincidencia de patrones, lo que es relevante si tu robots.txt usa directivas cómo Disallow: /search?session=. Prueba ambos modos cuando tus reglas incluyan patrones sensibles a query.

Casos de uso

  • Estima materiales antes de comprar para reducir desperdicio en el proyecto.
  • Compara escenarios en la obra y ajusta cantidades en tiempo real.
  • Crea planes de proyecto más claros con una lógica de cálculo transparente.

Completar la auditoría de rastreo e indexación

Guías

  • Cómo validar robots.txt antes del lanzamiento de un sitio

    La mayoría de errores de robots en un lanzamiento se pueden evitar. El problema no es que robots.txt sea difícil. El problema es que los equipos lo revisan demasiado tarde, prueban demasiado poco o confunden unas cuantas URLs correctas con una política de rastreo segura.

  • Cómo verificar hreflang antes de un lanzamiento multilingüe

    Los errores de hreflang son costosos porque desperdician el trabajo de localización después del lanzamiento. Una versión multilingüe puede parecer estructuralmente completa y aún así fallar en la segmentación por idioma si los enlaces recíprocos, el mapeo de URLs o la disponibilidad de páginas no se comprueban antes de publicar.

Ver guías

Páginas para decidir mejor

  • Auditor de robots.txt vs probador de robots.txt

    Estas herramientas se solapan, pero responden preguntas distintas durante un lanzamiento. El auditor de robots.txt es mejor cuando necesitas revisar el archivo completo como una política. El probador de robots.txt es mejor cuando necesitas una respuesta clara para una URL concreta y un bot concreto.

  • Herramientas SEO de lanzamiento gratuitas vs. de pago para equipos pequeños

    Los equipos pequeños suelen llegar a un punto de decisión antes del lanzamiento: ¿son suficientes las herramientas basadas en navegador gratuitas o esta publicación justifica una suite SEO de pago? La respuesta honesta depende menos de la ideología y más de la escala, la responsabilidad y la cantidad de riesgo concentrado en la ventana de lanzamiento.

  • Las mejores herramientas SEO en el navegador para revisiones previas al lanzamiento en sitios pequeños

    Los operadores individuales y los publishers independientes no necesitan una QA de nivel agencia. Necesitan una revisión corta y repetible que realmente vayan a ejecutar antes de publicar. El fallo más frecuente en los lanzamientos de sitios pequeños no es usar el método incorrecto, sino saltarse completamente la revisión porque ningún proceso obliga a hacerla. Esta shortlist cubre las herramientas en navegador que eliminan los errores de mayor riesgo en el menor tiempo posible para sitios construidos y publicados por una o dos personas.

Explorar biblioteca de aprendizaje

Herramientas y temas

  • Utilidades Web y Herramientas SEO

    Utilidades técnicas para sitios web: robots.txt, hreflang, validación de sitemaps, rastreo y diagnóstico de rendimiento.

  • Auditor de Robots.txt

    Ejecuta una auditoría estructural completa del archivo: conflictos, advertencias de sintaxis y verificaciones de buenas prácticas en todos los grupos.

  • Validador de Sitemap

    Verifica que las URLs que quieres rastrear están representadas correctamente en el sitemap.

  • Verificador Hreflang

    Valida las anotaciones de páginas internacionales una vez confirmado el acceso de rastreo.

Revisado por Klartext Tools

  • Revisado con el proceso editorial de Klartext Tools para flujos prácticos en el navegador.
  • Los supuestos y límites aparecen en la propia página antes de los bloques de apoyo a la decisión.
  • Incluye ejemplos y FAQ para contrastar el resultado con un segundo escenario.

Preguntas frecuentes

¿En qué se diferencia el Probador de Robots.txt del Auditor de Robots.txt?
El Probador se centra en un veredicto URL por URL: dado este robots.txt, este user-agent y estas rutas, ¿cuál es la decisión de acceso? El Auditor es más amplio y detecta problemas estructurales, conjuntos de reglas conflictivos y advertencias de buenas prácticas en todo el archivo. Usa el Probador para verificaciones de rutas específicas y el Auditor para una revisión completa de salud del archivo.
¿Por qué el resultado dice 'permitido' aunque hay una regla Disallow para esa ruta?
Probablemente una regla Allow más específica está anulando el Disallow. En robots.txt gana la ruta coincidente más larga, así que Allow: /admin/help/ supera Disallow: /admin/ para la ruta /admin/help/. Comprueba el campo de regla ganadora en el resultado para ver qué directiva gobernó realmente la decisión.
¿Descarga esta herramienta el robots.txt en vivo desde la URL que introduzco?
No. Pega el contenido de robots.txt directamente en el área de texto. Esto te permite probar una versión en borrador, un cambio propuesto o un archivo archivado: no solo lo que esté actualmente en vivo en un dominio.
¿Importa qué user-agent introduzco?
Sí, significativamente. Si el archivo tiene un grupo nombrado para el user-agent que introduces (ej. Googlebot), las reglas de ese grupo se aplican exclusivamente. Si no hay ningún grupo nombrado, el grupo wildcard (*) rige. Prueba tanto el crawler específico cómo el wildcard para entender cómo diferentes bots son tratados por el mismo archivo.
¿Puede robots.txt impedir que una página aparezca en los resultados de búsqueda?
Por sí solo, no. Robots.txt controla el acceso de los crawlers, no la indexación. Una URL bloqueada puede seguir apareciendo en los resultados de búsqueda si otros sitios enlazan a ella: el motor de búsqueda simplemente no puede ver el contenido de la página. Para prevenir la indexación, usa una etiqueta meta noindex o un encabezado de respuesta en una página a la que los crawlers puedan acceder.
¿Qué calcula Probador de Robots.txt frente a un analizador de robots.txt básico?
Probador de Robots.txt está diseñado para un caso de uso concreto: Prueba reglas de robots.txt contra user-agent y rutas URL con lógica de precedencia determinista. La herramienta está pensada para flujos de utilidades web y herramientas seo y mantiene resultados repetibles cuando trabajas con los mismos datos.
¿Qué entradas cambian más los resultados en probador de robots.txt?
Empieza por Contenido de robots.txt, User-agent a probar, URLs de prueba (una por línea). Cambios pequeños en esos campos suelen mover más la salida, así que conviene comparar al menos dos escenarios antes de decidir.
¿Sirve Probador de Robots.txt para comparar escenarios rápidamente?
Sí. Probador de Robots.txt está pensado para comparar escenarios hipotéticos con rapidez y contrastar supuestos en el navegador sin salir del flujo de trabajo.

Recomendaciones entre categorías

Si el problema va más allá de esta categoría, estas herramientas de otras áreas te ayudan con el siguiente paso.